gydtep
发表于 2022-2-7 10:20:51
业务场景建模-特征提取方法
本节重点介绍特征提取的通常方法,当前阶段,我们是以数据库的全量数据作为特征提取的来源,当然不少团队也在尝试使用接口调用过程中的全量入参数据。
gydtep
发表于 2022-2-7 17:07:13
同样,根据特征情况,也可以刻画出每个领域的特征模型,如下图所示,很轻松的看出领域的全量特征,同时根据每个特征,可以清晰的看出每个特征值的分布占比情况。
gydtep
发表于 2022-2-8 09:12:51
关于阿里巴巴的技术创新方向,以前我们内部常提“技术创造新商业”,技术如何带来商业文明的革新,是我们的创新方向。随着阿里巴巴的科技、业务、平台发展到现在的规模后,今年我们提出两个新的词:第一个是“高科技”,我们要深耕自立自强的高科技;还有一个是“好科技”,到底什么是好科技?有三个词是能够代表“好科技”的要求:
gydtep
发表于 2022-2-8 12:58:56
达摩院和杭州市拱墅区卫生健康局、浙江大学公共卫生学院联合打造了国内首个老年痴呆症AI筛查产品刚刚发布,最新的测试结果让我们非常有信心,机器筛查判断的可靠性基本能达到人工专业水平,还能把时间缩短到三分之一。
gydtep
发表于 2022-2-8 18:49:53
今天思考开源的时候,我们开始把技术团队自发的行动变成更加有系统、有组织的行动,我们更加系统地去看阿里巴巴应该开源什么,尤其在重要的构成未来数字世界根的领域,我们做重点开源的部署:包括操作系统、核心数据库、大数据计算、云原生四个领域
gydtep
发表于 2022-2-9 11:19:31
双11期间,预计阿里张北数据中心将使用绿电近3000万千瓦时,减排二氧化碳2.6万吨。公开数据显示,2021年1-9月,阿里巴巴共交易绿电2.48亿千瓦时。自2018年至2021年9月,仅张北数据中心就累计交易约6亿千瓦时新能源电量,累计实现二氧化碳减排近52.3万吨。
gydtep
发表于 2022-2-10 11:22:19
而IT系统经过几十年的飞速发展,整个开发模式、系统架构、部署模式、基础设施等也都经过了好几轮的优化,优化带来了更快的开发、部署效率,但随之而来整个的系统也更加的复杂、开发依赖更多的人和部门、部署模式和运行环境也更加动态和不确定,因此IT行业也已经到了需要更加系统化、体系化进行观测的这一过程。
gydtep
发表于 2022-2-10 17:14:36
业界也针对这种情况推出了各类可观察性相关的产品,包括开源、商业化的众多项目。例如:
Metrics:Zabbix、Nagios、Prometheus、InfluxDB、OpenFalcon、OpenCensus
gydtep
发表于 2022-2-10 19:12:39
统一的系统:拒绝割裂,能够在一个系统中支持Traces、Metrics、Logs的统一存储与分析
数据可关联:每种数据内部可以互相关联,也支持跨数据类型的关联,能够用一套分析语言把各类数据进行融合分析
gydtep
发表于 2022-2-11 12:42:21
经过一年多的打磨,我们希望用户在C端体验是所见即所得,灵活可配置,并为客户与伙伴提供便捷、可运营的交互体验,快速满足客户差异化的产品需求;