阿里云服务器1折起购，先领券再购买！ - 第362页 - IDC信息交流 - 落伍者

gydtep 发表于 2021-10-19 10:22:32

这不仅仅可以大大降低项目成本，还可以提高产出质量和团队满意度。总体来说，“前紧后松”是项目管理的一个重要原则。

gydtep 发表于 2021-10-19 15:46:12

在Dapper的启发下，业界诞生了很多用于分布式链路追踪的开源组件，为了保持对链路中每一个环节的记录与匹配，不仅需要在应用内部对跟踪信息进行传递，还需要让跟踪信息跨越不同的应用以及不同的分布式组件。

gydtep 发表于 2021-10-19 18:37:18

1 . 维护工作复杂：除了客户端的SDK和探针外，一套全链路监控方案在服务端有计算组件、存储组件、展示组件，都需要单独进行维护。以Jaeger为例，仅在数据存储方面需要维护一套独立的Elasticsearch集群，需要投入很大的工作量。

gydtep 发表于 2021-10-20 11:38:54

在应用列表视图，我们能看到每一个应用的健康度以及最近10分钟对外服务的响应情况。如果应用的状态列亮红灯，代表此应用运行不健康，我们可以继续点击红灯查看ARMS此应用生成的诊断报告，以进一步分析应用不健康的原因。

gydtep 发表于 2021-10-20 15:59:23

如果访问这个接口的上游应用也接入了ARMS，还能从链路上游页签查看每一个上游应用访问这个接口的请求数、响应时间和错误数。同样，如果这个接口对应的链路在离开这个应用后，还会继续访问接入了ARMS的下游应用，我们也能从链路下游页签查看到针对每一个下游应用的请求情况。

gydtep 发表于 2021-10-21 09:07:06

在外部调用视图中，会把下游应用每一个实例以IP+端口的形式进行呈现，我们可以通过这个视图快速定位下游应用是否有某个实例存在故障。

gydtep 发表于 2021-10-21 15:00:32

在这种情况下，我们需要利用TraceId提取出调用链路上的所有环节，进行统一的排查。点击TraceId所代表的链接，呈现出来的调用链路视图，就能帮助我们快速锁定真正存在性能瓶颈的应用。

gydtep 发表于 2021-10-21 19:13:46

报警覆盖了JVM监控、异常接口监控、调用类型统计、主机监控、数据库指标等多种类型，每一种类型都预定义了一系列的可选规则，允许使用者在一个报警中添加一条或多条规则。每一条规则都包含一条时间参数，代表报警基于最近多少分钟之内的统计结果，而多条规则之间可以是“与“或者”或“的关系。

gydtep 发表于 2021-10-22 13:06:44

当然，这是他们根据产品的情况以及公司所处的发展阶段做的取舍：当时公司不急着变现于是收入被拿掉了，日活做的数据没有太大作用于是被拿掉了，拉新也被拿掉了。

gydtep 发表于 2021-10-22 19:44:02

同时，要把数据结果融入到团队的工作流程里去，比如可以在早上八点把团队最关注的东西发到邮箱，市场推广人员可以看到相应的报表。在上午十点的时候，产品经理可以登录后台看到更新的产品功能。

页: 352 353 354 355 356 357 358 359 360 361 [362] 363 364 365 366 367 368 369 370

落伍者's Archiver