gydtep
发表于 2020-9-11 10:53:17
文本行识别全对率主要评价文字识别在POI名称,道路名称的整体识别能力,文本行识别高置信占比主要评价算法对于拆分出识别高准确率部分的能力,这两种能力与我们的业务需求紧密相关。
gydtep
发表于 2020-9-11 13:08:34
单字识别采用SENet结构,字符类别支持超过7000个中英文字符和数字。在单字识别模型中参考identity mapping的设计和MobileNetV2的结构,对Skip Connections和激活函数进行了优化,并在训练过程中也加入随机样本变换,大幅提升文字识别的能力。
gydtep
发表于 2020-9-11 15:42:15
在地图数据生产业务中经常会在道路标志牌中发现一些生僻的地点名称或者在POI牌匾中发现一些不常见的字甚至是繁体字,因此在文字识别效果优化中
gydtep
发表于 2020-9-11 16:54:33
同时以文字识别为代表的计算机视觉技术,已广泛应用于高德数据自动化生产的各个角落,在部分采集场景中,机器已完全代替人工进行数据的自动化生产。
gydtep
发表于 2020-9-12 09:21:36
。数据工艺人员的技能极大简化,大幅节约了培训成本和支出开销。
gydtep
发表于 2020-9-12 15:39:46
对比TextSR,首尔大学和马萨诸塞大学在Better to Follow文中提出通过GAN对特征的超分辨率方式,没有直接生成新的图像而是将超分辨率网络集成在检测网络中,在效果接近的同时,由于其采用End-to-End的模式,计算效率大幅提高。
gydtep
发表于 2020-9-12 19:41:20
MaxCompute支持多种经典计算模型(批处理、机器学习、交互式分析等)和完善的企业管理功能,借助MaxCompute,用户可轻松集成和管理企业数据资产,简化数据平台架构,加速价值实现。
gydtep
发表于 2020-9-12 20:11:37
MaxCompute 近期对产品的安全能力进行了全面升级。 发布的安全能力有:
· 细粒度授权
· 数据加密 (BYOK)
· 数据脱敏(数据**)
· 持续备份恢复
· 跨地域的容灾备份
· 实时审计日志
gydtep
发表于 2020-9-13 14:41:54
数据滥用指的是对数据的使用超出了其预先约定的场景或目的,数据滥用一般是靠故意的、带有目的性的动作完成的。
gydtep
发表于 2020-9-13 15:19:28
而应对数据滥用,最主要的应对是对数据使用做最小化授权,严格限制数据的被访问、使用的范围。