gydtep
发表于 2021-3-4 16:38:07
相比传统模块开发模式,使用设计稿生成代码技术后编码效率(模块复杂度和研发耗时比值)提升68%,固定人力单位时间模块需求吞吐量增加约 1.5 倍。
gydtep
发表于 2021-3-4 21:24:45
二是页面短期篡改。部分网站被恶意篡改后,对方经常会采用301重定向的形式去转移你的网站权重。而这个时候对方的策略是进行爬虫判断,当百度搜索爬虫访问的时候就会给出301跳转的状态,如果对方配置错乱,就可能会出现风险提示,而用户访问的时候并没有任何异常现象。
gydtep
发表于 2021-3-5 10:08:36
流式数据通道是新提供的一种服务,因为现在的上游服务大多数都是一些流式服务灌进来的,也就是说单并发可能流量没有那么大,但是都是比较细碎的数据,这种情况如果用批量数据通道会遇到很多限制。最明显的就是小文件问题,用批量数据通道写特别碎的数据进来会产生大量的碎片文件,跑SQL查询就会非常慢,用Tunnel下载也会非常慢。针对这种场景平台提供了流式数据通道服务,通过流式数据上来可以写得特别碎,一行写一次也可以,不需要担心小文件的问题,也不用担心并发的问题,并发可以无限多。流式数据通道是不限并发的,但是批量是限并发的。
gydtep
发表于 2021-3-5 13:17:23
这个功能也有使用限制。
第一,一个upload session不能超过2万个Block。
第二,Block ID会导致数据覆盖。
第三,upload session 24小时过期,因为writer数据是写在存储的临时目录的,临时数据有回收周期,超过24小时, writer写过的数据就有可能被回收掉,这个就限制了upload session的生命周期。
gydtep
发表于 2021-3-5 13:43:32
接口是CreateStreamUploadSession,写数据的从writer改成了RecordPack。所谓的pack其实相当于一个内存里的buffer,可以用pack.append(record),比如判断size只需要判断这个buffer足够大或者条数足够多,然后再flush就可以了(42到44行)。
gydtep
发表于 2021-3-5 15:47:50
因此,设计者对于产品需求的一些推理判断,可能会与真实情况有差别,即使他用了,那个以测试为目的的使用和真实的使用,还是有区别的。
由此可见,正是由于技术平台类产品中这种角色的错位,就容易导致需求把控出问题。
gydtep
发表于 2021-3-5 16:20:44
去年12月的一天,我们标注平台的相关同学开会,进行产品设计评审。
其间,针对一个标注页面的产品设计细节问题,在坐的产品经理、UED、前端、后端各个岗位的同学各抒己见、争论得不可开交。
gydtep
发表于 2021-3-5 16:50:49
突然间,我意识到一个严重的问题——那就是会议室的所有同学,并不是这个feature的用户。
因为具体的标注工作,都是外包公司的数百个标注人员做的,他们才是标注页面的真正用户。
gydtep
发表于 2021-3-6 11:30:37
作为互联网从业者,我们崇尚创新和颠覆,但我们还必须对行业保留敬畏之心。
于是,我们的产品经理同学就去把一些市场营销、广告文案经典书籍研读了一番,总结出了所谓“18种优质文案句式/模板”,这里面既有文案从业者的经验总结,也有广告学、心理学等领域的科学原理。
将这些“优质句式”、“文案法则”产品化之后,配合算法和技术,就能给业务输出更有效果的文案。
gydtep
发表于 2021-3-6 11:47:56
我们相信,机器不能完全代替人,机器智能和行业知识、专家经验等人类智慧,一定会相得益彰、交相辉映。