gydtep 发表于 2020-9-10 07:28:57

图像识别能力决定了数据自动化生产的效率,其中场景文字识别技术占据了重要位置。

dbkppf 发表于 2020-9-10 09:31:12

gydtep 发表于 2020-9-10 11:58:49

文字识别:对切割出的文字进行识别,一般采用提取人工设计特征(如HOG特征等)或者CNN提取特征,再通过机器学习分类器(如SVM等)进行识别;

gydtep 发表于 2020-9-10 15:06:20

因此将文本的检测与识别拆分开来,有利于分别优化两个不同的模型。

gydtep 发表于 2020-9-10 18:28:53

结合单字检测识别和序列识别各自的优缺点,采用互补的方式提高文字识别的准确率。

gydtep 发表于 2020-9-11 10:51:55

文本行识别全对率:表示文字识别正确且读序正确的文本行在所有文本行的占比。

gydtep 发表于 2020-9-11 15:40:54

这一模型通过注意力机制在不同解码阶段赋予图像特征不同的权重,从而隐式表达预测字符与特征的对齐关系,实现在一个模型中同时预测多个方向文本。

gydtep 发表于 2020-9-11 19:28:45

数据问题很重要,在没有足够的人力物力标注的情况下,如何自动扩充数据是图像的一个通用研究课题。

gydtep 发表于 2020-9-12 10:21:03

另外,图像的模糊问题往往会影响自动化识别的性能和数据的制作效率,如何识别模糊和对模糊的处理也是高德的研究课题之一。

gydtep 发表于 2020-9-13 14:40:39

数据总览、数据明细等信息能帮助用户了解自己有哪些数据以及数据的明细信息;
页: 70 71 72 73 74 75 76 77 78 79 [80] 81 82 83 84 85 86 87 88 89
查看完整版本: 阿里云服务器1核2G低至69元/年!