gydtep
发表于 2020-8-13 14:15:32
另外一方面,完美日记对数据的重视程度也在不断提高,尤其是用户数据的重要性。
gydtep
发表于 2020-8-13 14:50:21
Flink支持不同的重启策略,可以控制在发生故障时如何重启新启动作业。
默认重启策略是通过Flink的配置文件设置的flink-conf.yaml。配置参数restart-strategy定义采用的策略。
如果未启用检查点,则使用“无重启”策略。如果激活了检查点并且尚未配置重启策略,则固定延迟策略将用于 Integer.MAX_VALUE重启尝试。
gydtep
发表于 2020-8-13 15:21:57
还需要大量运维人员解决运行时出现突然的各种问题。从成本和效率等维度来看,并不是一条便捷的路,思虑再三,完美日记最终选择阿里云容器服务ACK。
gydtep
发表于 2020-8-13 19:02:07
将整个K8s UAT环境按照双11量级进行四轮压力测试,将结果反馈,然后不断进行调整。
gydtep
发表于 2020-8-14 10:37:22
另外,完美日记也通过ARMS Prometheus来监控系统可能出现的问题,并能针对性地解决问题。
gydtep
发表于 2020-8-14 13:09:24
服务模块不可用会自动剔除,自动重启服务模块。服务器宕机时,服务器上运行的服务模块会自动转移到可用服务器上,无需人工干预,工作量减少100%。
gydtep
发表于 2020-8-14 15:02:06
运维人员是否有足够的能力来应对大规模应用带来的挑战,研发人员是否有足够的技术准备能随时解决大规模应用带来的问题,
gydtep
发表于 2020-8-14 15:19:05
产品的架构设计是否可以满足未来的企业需求,同时组织架构和文化是否已经适应企业新的战略发展等。
gydtep
发表于 2020-8-14 16:53:02
Ingress、Docker配置化、Deployment配置、Service等往往已经到了开发人员对技术认知的边界了,这就需要花费较长的时间去解答大家的疑问,才能往下一步进行。
gydtep
发表于 2020-8-14 19:06:05
二是使用ECI+HAP+EW+AHAS(自动扩容数据来源)进一步优化成本,应对突发流量;三是考虑采用服务化网格技术。