gydtep 发表于 2020-7-26 16:26:05

“可编程“让云服务将自己的核心能力延伸出去,让开发者基于此编写相关应用,不但解决了定制化需求支撑的问题,云服务还升级为应用平台,建立开发者生态。

gydtep 发表于 2020-7-26 17:08:42

因此领先的云服务商的产品体系都在迅速 Serverless 化,不断加强产品间的集成和被集成的能力。

gydtep 发表于 2020-7-27 09:40:38

因为初级处理不了,所以直接重启服务器,一段时间后一切恢复正常,可是第二天又来一次这种情况。

gydtep 发表于 2020-7-27 10:33:21

目前掌握的信息就是:在毫无征兆的情况下,CPU暴涨到100%,重启之前一直保留,重启之后恢复原样。

gydtep 发表于 2020-7-27 13:20:40

关于用lsof打开文件数找到的线索,排序打开文件找出进程号 lsof -n|awk '{print $2}'|sort|uniq -c|sort -nr|more

gydtep 发表于 2020-7-27 14:39:22

第二天同样时间,ECS果然暴涨了CPU。这是时候zabbix的工作如希望进行保留了一台故障的ECS1给我。

gydtep 发表于 2020-7-27 16:17:26

各项参数都正常,现在聚焦在打开的文件数这个问题上面。也可以用另外同一种方式查看一下内核统计文件 /proc/sys/fs/file-nr,比较一下差异,看看能不能找出问题。

gydtep 发表于 2020-7-27 18:36:24

程序的bug和部署不当,那是不可能的,因为主要问题来自于打开句柄数,当部署到ECS2那里,一切正常。

gydtep 发表于 2020-7-28 10:07:45

可以理解为CPU使用100%,程序无响应外面的tcp请求超时。这是结果,还是没有找到根本原因。

gydtep 发表于 2020-7-28 10:52:47

原因确认了,但是必须找到根源,为什么忽然有这么大的打开文件数。关掉全部docker容器和docker引擎,打开文件数是少了一点,但是仍然在65535差不多。
页: 49 50 51 52 53 54 55 56 57 58 [59] 60 61 62 63 64 65 66 67 68
查看完整版本: 免费领取阿里云代金券2020元啦!新老用户同享。