gydtep 发表于 2020-8-3 15:41:38
比如,夏天大家有空喜欢吃点烧烤喝点啤酒,描述意图的方式,说「我想去撸串」这一句就够了。gydtep 发表于 2020-8-3 15:55:17
而描述过程,就需要说「我今天晚上下班后,叫上老王小李,去公司楼下的烧烤店,点100个串和10个啤酒,最后用支付宝扫码付款」。gydtep 发表于 2020-8-3 19:04:54
在 Jupyter Notebook 中,输入的 SQL 语句会发送到 SQLFlow server 完成编译和执行。gydtep 发表于 2020-8-4 08:34:27
抽取数据之后需要进行数据预处理,比如去掉错误的数据,填充缺失的数据,整理,排序等gydtep 发表于 2020-8-4 11:10:05
在预处理阶段,有可能需要编写 MapReduce Job 来处理 HDFS 上的大量的数据,或者使用 Hive 编写 SQL 语句完成处理,亦或直接编写 Python 代码处理数据;gydtep 发表于 2020-8-4 13:46:07
SRE同学则会把控上线之前的各项准备,包括预发测试是否通过,压力测试是否通过,CPU负载是否有提升,硬件资源是否能承载新的模型,gydtep 发表于 2020-8-4 15:36:44
这里也有两个统计图,统计了数据科学类任务所使用的工具的流行程度和增长趋势。gydtep 发表于 2020-8-4 15:48:28
SQL 语言流行程度排名第三,增量排在第四名。数据科学领域正在更多的使用 SQL 是我们希望使用 SQL 语言描述AI任务的原因。gydtep 发表于 2020-8-4 17:49:24
同时,用户可以连接到公开 Model Zoo 获取或者贡献新的模型。gydtep 发表于 2020-8-4 19:02:33
SQLFlow 提供了丰富的内置模型和 Model Zoo,用户只需要编写 SQL 就可以完成完整 AI 任务的构建,算法同学可以更加专注于建模工作,大大降低构建 AI 系统的成本和时间。