gydtep
发表于 2021-8-17 10:42:12
今年在前端智能化大背景下,对 D2C 技术体系全链路进行了智能化能力升级,并为前端同学带来了让前端工程师能成为机器学习工程师的前端算法工程框架 Pipcook 和解决样本收集问题的样本制造机 Samplecook。同时带来了营销模块研发链路产品化升级,助力全链路研发提效。
gydtep
发表于 2021-8-17 15:35:16
去年我们在组件识别、图片识别、文本识别这几个方向都有探索和实践,识别的结果最终用于语义化和字段绑定,但使用的技术方案对识别的效果限制较大,今年我们做了如下改进:
gydtep
发表于 2021-8-17 19:13:45
在业务逻辑生成阶段优化原有的配置链路,将业务逻辑库与算法工程链路解耦,并承接所有识别结果的应用和表达。物料识别阶段只关心 UI 中有什么物料,不关心识别的结果如何用于生成代码,布局还原阶段的循环识别和多态识别同理。这样做的好处是我们可以自定义识别结果的表达,并且可以让用户感知智能识别的结果并选择是否使用。
gydtep
发表于 2021-8-18 10:04:30
智能化方式无论是使用计算机视觉还是深度学习技术,都会有准确率的问题,准确率低在线上环境可能无法被接受。需要建立一套与线上用户使用数据形成闭环的算法工程链路,实现样本自动化收集、算法工程链路的闭环才能让模型线上识别准确率不断提升。
gydtep
发表于 2021-8-18 16:13:24
第二个因素是TTFB速度。TTFB首字节加载速度,往往是衡量一个网站服务器整体响应能力的重要指标,它包括网站服务器主机的配置是否能够轻松的应对短期内大量的并发访问。特别是对于一些大型网站,如果独立数据库出现大量集中访问的情况,也会造成首字节加载速度迟缓导致网站不稳定。
gydtep
发表于 2021-8-18 20:47:04
相信经过上述的讲解,大家已经了解了搜索引擎出现类似提示的原理,整体来说,出现类似的提示意味着网站出现稳定性的问题,造成访问出现障碍,我在很多搜索引擎上都看到过这样的提示,可以说是行业的通用做法。理论上来说,当网站出现问题时,搜索引擎会第一时间进行机器识别并给出“该页面因服务不稳定可能无法正常访问”的提示,如果问题没有解决,这个提示也会持续存在。
gydtep
发表于 2021-8-19 10:08:38
做产品不能闭门造车。于是,我们就随即安排相关同学去了标注外包公司做现场调研。
一开始,我们与几个标注团队的小组长进行小范围的初步沟通。当时,随口问了下产品使用情况,他们一致反馈“没什么问题,挺好用的”。
gydtep
发表于 2021-8-19 13:56:39
如果你只是将这个需求做了,那是不够的。
为什么呢?因为用户要的模型报告,只是“浅层需求”——他的确需要看各种指标,但他最想要的是,在新模型训练出来后,他要对不同版本的模型效果进行对比——不仅要知道指标是多少,更想知道指标的具体变化,哪些升了、哪些降了以及具体数值是多少。
gydtep
发表于 2021-8-19 16:46:56
谈完“需求/用户分层、五级火箭”了,那是否就是对用户需求360度、无死角地满足了呢?
答案是否定的,因为我们还没有做到“无我境界” 。
gydtep
发表于 2021-8-20 09:22:10
首先,可以将平台通用的框架和模块,抽象出来、统一起来,包括Portal页、项目管理、权限管理、数据管理、任务管理、发布管理等等。