gydtep
发表于 2022-3-17 12:16:03
作为电气工程上可观察性的巅峰,自动驾驶将汽车获取到的各类内外部数据发挥到极致,总结起来主要有几下几个核心的要素:
丰富的数据源:汽车外围遍布多个激光/图像雷达,能够实现高帧率、360°实时观测周围的物体及其状态;内部则能够实时知道当前的车速、车轮角度、胎压等信息,做到知彼知己。
gydtep
发表于 2022-3-18 14:05:07
·第二层是业务安全,这一层会更关注在流程机制安全上,如何杜绝删库跑路。比如内部人员,因为本身流程不规范,出现了业界最常说的删库跑路行为,是业务安全的属性,需要运维人员去完善。
gydtep
发表于 2022-3-18 14:17:26
·第三层则是业务合规,这一点特别是在一些金融、保险、政府等敏感行业上,本身会有数据合规需求,比如两地三中心、操作审计等监管必须能力。
gydtep
发表于 2022-3-18 14:40:37
为什么这一点会是最重要的,大家日常做运维肯定都知道,眼前的事情肯定最重要,一旦不合规,业务都上不了线,那业务数据本身也就产生不了价值。所以从业务相关角度来讲,业务合规安全性最重要。
gydtep
发表于 2022-3-18 15:06:56
安全无小事
数据库安全问题,70%甚至80%以上都是由人祸造成的。不管是外在或者是内部的人,不管是因为客观性攻击数据库,或者是主观性破坏数据库,人祸都占了很大部分。
gydtep
发表于 2022-3-19 17:37:26
他的观点是,见到用户不能只是“就事论事”,只问产品使用相关的浅层次的问题。(即使问这样的问题,也不能问“你有什么需求”之类很难获得真实需求的直白的问题)。
gydtep
发表于 2022-3-21 10:00:54
异源数据
行人重识别任务也存在异源数据问题,但是该任务的异源更多是不同相机拍摄以及不同场景的区别。而在POI牌匾检索场景中,存在更严重的异源数据问题,如下图所示:
gydtep
发表于 2022-3-21 14:12:50
因此,我们针对该问题进行了相应优化:1)采用多趟资料匹配结果,提升同一类别下牌匾的多样性;2)采用Batch采样策略以及MDR loss来降低模型对错误标签数据的敏感性。
gydtep
发表于 2022-3-21 14:43:19
我们借鉴了传统特征点匹配算法思想,利用Sift特征点匹配算法对两趟资料中的所有牌匾进行两两匹配,并通过内点数量对匹配结果进行筛选,即内点数量大于阈值的匹配牌匾视作同一牌匾。
gydtep
发表于 2022-3-22 09:43:30
,即半监督学习以及主动学习。半监督学习利用有标签数据训练出的模型来对海量无标签数据产生伪标签,进一步标签数据和伪标签数据混合后再优化模型。主动学习是利用有标签数据训练出的模型对海量无标签数据进行数据挖掘,