gydtep
发表于 2020-11-1 11:30:41
但随着互联网的发展,业务系统Scope越来越大,需要在质量、可用性和可运维性上有更高的要求。
gydtep
发表于 2020-11-1 12:53:11
从个人视角转化到行业视角也能发现一个趋势:在十几年前,研发的时间会花在三个部分:创新(编码),部署+上线,观察+分析,
gydtep
发表于 2020-11-1 13:17:04
并且部署+上线会花费大量的时间。近几年云计算和云原生的兴起解放了开发运维在部署、上线和环境标准化上的精力。
gydtep
发表于 2020-11-1 17:24:26
构建中台的思路看起来很直接,要做这件事情有哪些挑战呢?
我们可以从数据源、分析和判别这三个过程来分析:
gydtep
发表于 2020-11-1 19:54:19
SLS向下对接各种开源的协议与数据源,向上对各种场景提供支撑能力。核心能力在于围绕可观察性的各种监控数据,提供统一的存储与计算能力,平台可以用 “1、2、3、4” 四个词来概括。
gydtep
发表于 2020-11-1 20:47:49
为了构建可观察性的中台,我们先看看目前存储系统的现状。在运维领域AIOps系统的构建过程中,长期并存四种类型的存储系统,分别是:
gydtep
发表于 2020-11-2 09:47:08
所有的事物都是一个待续变化的过程,例如数据库的一张表在某一个时刻(例如2点)的状态实际上是由历史上所有变化累计的结果。
gydtep
发表于 2020-11-2 12:43:56
在Binlog之上,我们可以挑选某些字段生成一个Logstore,Logstore可以认为是数据库的一个表:是带Schema的,至少有EventTime这个字段(事件发生的原始时间),可以指定列的类型和名字。
gydtep
发表于 2020-11-2 14:17:00
这里需要有一套低代码开发的语言来做各种各样的数据转化、分派、富化,把多个业务系统不同格式的数据进行简化。
gydtep
发表于 2020-11-2 15:13:19
第三个问题是算法的问题,我们内置了大量基于AI的巡检、预测、聚类、根因分析等算法,可以在人工分析和自动巡检告警中直接使用到。
页:
1
2
3
4
[5]
6
7
8
9
10
11
12
13
14