gydtep
发表于 2021-8-20 16:49:49
这里,再分享一个考虑平台协同创新的思路,那就是“图解法和穷举法”。
一开始,平台协同创新都是散点发生的,想到一个就做一个,很不系统和体系化。
后来,为了把所有“连接”和“协同”的可能性都穷尽,我们就画了一张系统协同大图和矩阵图,把所有的平台都放进去,全方位地思考平台之间有什么没有打通的,有什么协同创新的可能性。
gydtep
发表于 2021-8-20 17:37:58
平台中的人性对抗
大家常说,有人的地方就有江湖。一个平台,也是一个江湖。
不同角色、诉求的人参与其中,人性就展示出来了。
因此,就需要思考人的事情,就需要对平台进行运营和治理。
gydtep
发表于 2021-8-21 12:06:41
这样,将整个平台从“纯人工标注”,转变为了“智能辅助标注”,大大提升了标注效率、降低了标注成本。
沉淀数据资产,创造更大的价值
如果一个平台有数据的沉淀,那么这些数据就需要深度挖掘,从而产生更多、更大的价值。
gydtep
发表于 2021-8-21 12:21:07
比如,每个业务最开始接入知识图谱平台,为了解决自己的业务问题,就得从头建Schema、导数据。但随着平台的发展,沉淀的知识越来越丰富。那么,后续的平台就能直接受益于之前沉淀的知识,而不一定要自己重新建设了。这就是,平台数据沉淀出的价值。
gydtep
发表于 2021-8-21 12:38:47
再比如,标注平台里的标注数据,在完成模型训练之后,生命周期就终结了,躺在那里没有人管了,这是很可惜的。
现在我们计划将这些数据沉淀下来、开放出去,让数据产生更大的价值。
gydtep
发表于 2021-8-21 13:35:06
首先,标注数据对内开放。在业务刚接入AI平台,存在一个冷启动的阶段,最缺的是打标的数据。所以,可以将标注平台中海量标注数据梳理和开放出来,让业务可以先到平台里面搜索下,看看有没有已有的数据,有的话,就可以复用。如果没有,再考虑重新建数据。
gydtep
发表于 2021-8-21 19:11:15
然而,现实情况是,业务同学为了简单、好把控,往往都想自己创建一个类型。于是,在平台上就出现了类似Company1、Company2这样重复的类型。
gydtep
发表于 2021-8-21 19:35:21
在图谱平台上,除了Schema重复,数据也存在重复、不一致的情况,这些都需要一个一个进行治理。
然而,平台治理这件事,既是科学也是艺术——既不能放任自由,也不能卡的太严。尤其是在平台建设的初期,如果限制得太死,业务方是很难理解和配合的,甚至会丢掉客户。
gydtep
发表于 2021-8-21 19:58:40
所以,要把握好力度。
2 “滥用”与“违规”
上面提到的这些平台治理的问题,其实还不算太糟糕。
gydtep
发表于 2021-8-21 20:30:37
接下来,给大家介绍一些需要高度重视和严肃处理的“滥用、违规”的行为。
分别是标注平台中的两个真实案例:“任务释放”和“串通磨洋工”。
先说第一个,“任务释放”功能的滥用。