gydtep 发表于 2021-3-4 07:13:04

如何能智能生成像人工编写这样的代码,这是智能还原这部分要解决的事情。我们把 D2C 智能还原部分做了能力分层,每一层的输入和输出都是 JSON,智能还原部分的本质是一层一层的做 JSON 转换,这就是整个智能还原的流程。如果需要对生成的 JSON 做修改,可以通过 imgcook 编辑器可视化干预,最终通过 DSL 开放层将得到的符合代码结构和语义的 JSON 转换为代码。

gydtep 发表于 2021-3-4 11:41:23

去年我们在组件识别、图片识别、文本识别这几个方向都有探索和实践,识别的结果最终用于语义化和字段绑定,但使用的技术方案对识别的效果限制较大,今年我们做了如下改进:

gydtep 发表于 2021-3-4 16:55:27

智能化方式无论是使用计算机视觉还是深度学习技术,都会有准确率的问题,准确率低在线上环境可能无法被接受。需要建立一套与线上用户使用数据形成闭环的算法工程链路,实现样本自动化收集、算法工程链路的闭环才能让模型线上识别准确率不断提升。

gydtep 发表于 2021-3-5 10:08:12

现在有两套API,分批量数据通道和流式数据通道。
批量数据通道目标的场景单并发的吞吐量很大,这种理想的场景是传量大的数据,一次一批,QPS和并发都不能特别高,但是单并发的吞吐量可以做得很大,这个在API上也有一些优化。

gydtep 发表于 2021-3-5 15:18:32

另外有几个场景,transaction现在支持批量上传,流式上传后续会跟进。目前流式上传不支持Insert Overwrite,可能后面也不一定会开发,因为这个场景明显是一个批量的语义。

gydtep 发表于 2021-3-5 18:37:50

钉钉原负责人无招同学来蚂蚁做“钉钉创业之路”的分享时,也谈到这个问题。
他的观点是,见到用户不能只是“就事论事”,只问产品使用相关的浅层次的问题。(即使问这样的问题,也不能问“你有什么需求”之类很难获得真实需求的直白的问题)。

gydtep 发表于 2021-3-6 11:30:15

然而,大家知道,算法的提升不可能一蹴而就,算法效果都是慢慢地打磨和优化的。

在这个过程中,产品经理同学不能干等。

于是,我们就在思考,不管多么高深的算法、多么智能的平台,我们生产的仍然是文案。而文案这个岗位,随着广告行业的发展已经存在了数百年,那么,一定有成熟的方法论和模式。

gydtep 发表于 2021-3-7 11:01:20

于是,我们就改成了一页展示一二十张图片,标注人员只需要扫一眼,把其中“对”或者“错”的勾选出来,然后整体提交就好了(同时也减少了每一页刷新页面、加载图片的等待时间)。这样简单的一个改动,其实并没有什么技术难度,但标注效率直接提升了好多倍。

gydtep 发表于 2021-3-8 08:33:05

比如,知识图谱平台的知识更新和智能文案平台的文案发布,都需要走打标和确认流程,我们发现标注平台的标注能力就够用了。所以,我们就没有重新开发,而是在平台之间打通连接,快速解决了这个问题。

gydtep 发表于 2021-3-8 16:06:00

做运营、做推广,也需要有一个品牌的体系。所以,我们构造出了一个“AI特派员”的形象。对于我们对内发布的所有文章、视频和海报,都纳入到这个体系当中。比如,所有的内网文章标题、文章的首尾都统一格式,加入“AI特派员”的名称和形象,这样既方便形成统一认知,也方便大家日后检索信息。
页: 97 98 99 100 101 102 103 104 105 106 [107] 108 109 110 111 112 113 114 115 116
查看完整版本: 阿里云服务器1核2G低至76元/年,先领券,再购买!