dbkppf 发表于 2020-9-10 09:33:48

gydtep 发表于 2020-9-10 10:48:09

图像来源多样:图像采集自低成本的众包设备,成像设备参数不一,拍摄质量差。图像往往存在倾斜、失焦、抖动等问题。

gydtep 发表于 2020-9-10 13:24:39

文本行检测从方法角度主要分为基于文本框回归的方法,基于分割或实例分割的方法,以及基于回归、分割混合的方法,

gydtep 发表于 2020-9-10 15:07:06

目前高德采用的算法框架由文本行检测、单字检测识别、序列识别三大模块构成。

gydtep 发表于 2020-9-10 15:53:02

不同于一般文字识别评测以单字为维度,我们在业务使用中,更关注于整个文本行的识别结果,因此我们定义了符合业务使用需求的文字识别评价标准:

gydtep 发表于 2020-9-10 18:29:24

单字检测采用Faster R-CNN的方法,检测效果满足业务场景需求。

gydtep 发表于 2020-9-10 19:30:51

单字识别采用SENet结构,字符类别支持超过7000个中英文字符和数字。在单字识别模型中参考identity mapping的设计和MobileNetV2的结构

gydtep 发表于 2020-9-11 09:49:36

在训练过程中,使用online的数据增广方法,在训练过程中对数据进行旋转、翻转、mixup等,有效的提高了模型的泛化能力。

gydtep 发表于 2020-9-11 11:07:32

单字检测识别的训练样本组织和模型训练相对容易,不被文字排版的顺序影响。缺点在某些"上下结构","左右结构"的汉字容易检测识别错误。

gydtep 发表于 2020-9-11 13:42:24

文字区域纠正和文字区域特征提取将变形的文本行纠正为水平文本行并提取特征,降低了后续识别算法的识别难度。
页: 396 397 398 399 400 401 402 403 404 405 [406] 407 408 409 410 411 412 413 414 415
查看完整版本: 阿里云2000元专属红包领取及使用说明