gydtep 发表于 2020-9-11 13:53:33

序列化编码图像特征和文字特征解码(Encoder-Decoder的结构)能在利用图像的纹理特征进行文字识别的同时,引入较强的语义信息,并利用这种上下文的语义信息来补全识别结果。

gydtep 发表于 2020-9-11 16:10:52

文本序列识别模型目前已覆盖英文、中文一级字库和常用的繁体字字库,对于艺术文本、模糊文本具有较好的识别性能。

gydtep 发表于 2020-9-11 18:03:34

目前高德主要依赖深度学习的方式解决场景文字的识别问题,相对国外地图数据,国内汉字的基数大,文字结构复杂导致对数据多样性的要求更高,数据不足成为主要痛点。

gydtep 发表于 2020-9-11 18:51:46

外,图像的模糊问题往往会影响自动化识别的性能和数据的制作效率,如何识别模糊和对模糊的处理也是高德的研究课题之一。

gydtep 发表于 2020-9-12 13:26:10

另一种数据扩充的解决办法是数据合成,例如阿里巴巴达摩院的SwapText利用风格迁移的方式完成数据生成。

gydtep 发表于 2020-9-12 13:58:51

模糊通常造成场景识别文本未检测和无法识别的问题。在学术界超分辨率是解决模糊问题的主要方式之一,TextSR通过SRGAN对文本超分的方式,还原高清文本图像,解决模糊识别的问题。

gydtep 发表于 2020-9-12 15:26:04

对比TextSR,首尔大学和马萨诸塞大学在Better to Follow文中提出通过GAN对特征的超分辨率方式,没有直接生成新的图像而是将超分辨率网络集成在检测网络中,在效果接近的同时,由于其采用End-to-End的模式,计算效率大幅提高。

gydtep 发表于 2020-9-12 19:05:32

MaxCompute作为企业级SaaS模式云数据仓库,正在为客户业务及其数据提供持续的安全保护。

gydtep 发表于 2020-9-13 08:58:35

MaxCompute 可以帮助用户很好的回答这些问题。 MaxCompute 平台构建了统一的元数据管理,基于统一元数据和完备的平台日志,向用户提供元数据和相关日志数据。

gydtep 发表于 2020-9-13 10:21:16

用户可以基于 MaxCompute 的 Information Schema,构建自己的数据管理应用。
页: 397 398 399 400 401 402 403 404 405 406 [407] 408 409 410 411 412 413 414 415 416
查看完整版本: 阿里云2000元专属红包领取及使用说明