gydtep
发表于 2020-9-10 21:23:58
在2019年4月,为了验证在文字识别的算法能力,我们在ICDAR2019-ReCTS文字识别竞赛中获得第二名的成绩(准确率与第一名相差0.09%)。
gydtep
发表于 2020-9-11 12:29:46
但是现实场景文本的排版复杂,"从上到下","从左到右"排版会导致序列识别效果不稳定。
gydtep
发表于 2020-9-11 16:30:03
除了对于模型的优化外,合理补充缺字、少字的样本也是非常重要的环节。为了补充缺字、少字的样本,我们从真实样本挖掘和人工样本合成两个方向入手,
gydtep
发表于 2020-9-12 09:19:35
高德文字识别算法通过对算法结构的打磨,和多识别结果的融合,满足不同使用场景的现实需要。
gydtep
发表于 2020-9-12 09:20:12
同时以文字识别为代表的计算机视觉技术,已广泛应用于高德数据自动化生产的各个角落,在部分采集场景中,机器已完全代替人工进行数据的自动化生产。
gydtep
发表于 2020-9-12 19:40:15
MaxCompute 是一款云原生、高效能的SaaS模式企业级数据仓库服务,被广泛用于构建现代化企业数据平台,开展BI分析、数据化运营、画像及推荐、智能预测等应用场景。
gydtep
发表于 2020-9-14 09:57:45
PRIVILEGES 和 HISTORY 类的视图,可以帮助用户对数据权限使用、任务执行等维度做分析审计。
gydtep
发表于 2020-9-14 14:16:21
如何写出干净优雅的代码是个很困难的课题,我没有找到万能的 solution,更多的是一些 trade off,可以稍微讨论一下。
gydtep
发表于 2020-9-14 16:45:04
规范里一般都包括了如何进行变量、类、函数的命名,函数要尽量短并且保持原子性,不要做多件事情,类的基本设计的原则等等。另外一个建议是可以多参考学习一下开源项目中的代码。
gydtep
发表于 2020-9-15 10:59:24
我们可以去我们的代码库里面搜索一下 TODO,看看有多少,并且有多少是多少年前的,我相信这个结果会让你很惊讶