gydtep
发表于 2021-10-21 08:14:16
当一个应用对外提供多个服务接口的时候,如何从分析每一个接口的服务质量,以及每一个接口对应的链路详细情况呢?这个时候接口调用视图就能发挥重要的作用。从这个应用所有提供的接口中,我们可以选中需要分析的单个接口,与这个接口相关的链路信息就能够从多个维度展示出来,其中包括接口的请求数、响应时间、错误数、返回状态码,以及在接口所对应的链路中,应用访问外部数据库(包括关系型数据库,以及Redis等非关系型数据库)的情况。
gydtep
发表于 2021-10-21 13:45:07
接下来,我们进入接口快照视图,在这个视图中,ARMS记录了每一次具体接口调用的情况,包括耗时、状态、以及对应的TraceId。按照耗时从大到小的顺序,对列表进行排序,就能够找到指定时间内耗时最长的调用。
amdj999
发表于 2021-10-21 13:46:41
:lol::P
gydtep
发表于 2021-10-21 18:29:04
我可以在报警管理 > 联系人管理页面创建联系人,指定联系人用于接收通知的手ji号码和邮箱地址,也可以提供用于自动发送报警通知的钉钉机器人地址。
gydtep
发表于 2021-10-22 10:45:38
如上图所示,Phase 1是初定的观测指标,包括日活、PV、注册书、功能使用次数、收入、客单价、日活跃占比、新老用户占比、增长率、X转化率等。他们的CEO发现,虽然该有的指标都有,但就是因为都有才失去了聚焦。于是开始精简思路,把团队力量凝聚到一根绳上,Phase 3是最终剩下的两个指标。
gydtep
发表于 2021-10-22 17:58:30
为什么这么说?以手机淘宝为例,手机淘宝的终端有网页、安卓、iOS、小程序等,页面浏览和功能交互都有不同的部分,如果完全分开按照最糟糕的情况永远规范不好。
gydtep
发表于 2021-10-23 16:47:46
基于ML的预测性维护的两个最重要的好处是它的快速性和准确性。 AI可以足够快速、准确地识别机械问题,以便在发生故障和故障之前进行纠正。例如,通用汽车使用安装在装配机器人上的摄像头,通过使用,它能够在5000多个机器人中检测出数十个组件故障,从而避免了停机的可能性。
gydtep
发表于 2021-10-25 08:18:57
控制复杂性。由于业务的复杂性,需要我们用更好的手段帮助研发组织克服认知障碍,更好的分工协作。分而治之,关注点分离等手段皆是如此。
gydtep
发表于 2021-10-25 14:11:23
在 API 领域,最重要的趋势是标准化技术的崛起。gRPC 是 Google 开源的的高性能、通用的、平台无关的 RPC 框架。它采用分层设计,其数据交换格式基于 Protobuf (Protocol Buffers) 协议开发,具备优秀的序列化/反序列化效率,也支持众多开发语言。
gydtep
发表于 2021-10-25 18:53:21
是一种以通用、一致的方式描述事件数据的规范,由 CNCF Severless 工作组提出,提升了事件驱动应用的可移植性。目前,阿里云 EventBridge、Azure Event Grid 等事件处理中间件,以及 Knative Eventing ,阿里云函数计算等 FaaS 技术已经提供了对 CloudEnvents 的支持。