gydtep
发表于 2020-9-10 10:07:44
与此同时,由于采集来源和采集环境的复杂性,高德场景文字识别算法面对的图像状况往往复杂的多。
gydtep
发表于 2020-9-10 11:59:17
后处理:利用规则,语言模型等对识别结果进行矫正。
传统的文字识别方法,在简单的场景下能达到不错的效果,但是不同场景下都需要独立设计各个模块的参数,工作繁琐,遇到复杂的场景,难以设计出泛化性能好的模型。
gydtep
发表于 2020-9-10 12:13:01
2012年之后,随着深度学习在计算机视觉领域应用的不断扩大,文字识别逐渐抛弃了原有方法,过渡到深度学习算法方案。
gydtep
发表于 2020-9-10 14:22:02
与学术界不同,我们没有采用End-to-End的识别框架,是由于业务的现实需求所决定的。
gydtep
发表于 2020-9-10 15:24:34
我们根据实验,决定在两阶段的实例分割模型的基础上,针对实际问题进行了优化。
gydtep
发表于 2020-9-10 16:08:24
文本行识别全对率主要评价文字识别在POI名称,道路名称的整体识别能力,文本行识别高置信占比主要评价算法对于拆分出识别高准确率部分的能力,这两种能力与我们的业务需求紧密相关。
gydtep
发表于 2020-9-10 16:23:22
为了满足业务场景对文字识别的需求,我们针对目前主流的文字识别算法进行了调研和选型。
gydtep
发表于 2020-9-10 21:24:32
近年来,主流的文本序列识别算法如Aster、DTRT等,可以分解为文字区域纠正,文字区域特征提取、序列化编码图像特征和文字特征解码四个子任务。
gydtep
发表于 2020-9-11 10:05:27
不同于一般文字识别评测以单字为维度,我们在业务使用中,更关注于整个文本行的识别结果,因此我们定义了符合业务使用需求的文字识别评价标准:
gydtep
发表于 2020-9-11 12:30:15
结合单字检测识别和序列识别各自的优缺点,采用互补的方式提高文字识别的准确率。