gydtep
发表于 2021-12-31 10:42:56
Databricks的notebook提供的数据共享能力和流批一体的数据架构,满足了客户处理和识别数百万用户的流式和批式数据的需求,并且接口统一。客户APP参与度提高了4.5倍、数据处理事件从6小时缩短至6秒、用一个数据湖代替了原有的14+个数据库,效能大幅提升。
gydtep
发表于 2021-12-31 16:50:41
另一种方法是使用已知可以在边缘AI中很好地工作的网络体系结构,并直接为目标平台训练它们。他发现,鉴于训练数据的数量和种类足够多,就绝对性能而言,这种方法通常可以胜过跨平台编译器方法。但是,它还需要在培训期间以及预处理和后期处理中进行一些手工操作。
gydtep
发表于 2022-1-4 08:58:50
作为互联网从业者,我们崇尚创新和颠覆,但我们还必须对行业保留敬畏之心。
于是,我们的产品经理同学就去把一些市场营销、广告文案经典书籍研读了一番,总结出了所谓“18种优质文案句式/模板”,这里面既有文案从业者的经验总结,也有广告学、心理学等领域的科学原理。
gydtep
发表于 2022-1-4 13:09:05
比如,有一种图像分类任务,你只需要标注“对”还是“错”。
之前的设计,是每页展示一张大图,答完题后就切换到下一页。当我们自己亲自标注了几十张之后,就感觉这样的效率很低。
gydtep
发表于 2022-1-5 09:56:44
如果你是一名网站运营人员,突然发现自己运营的网站被百度搜索标记“该页面因服务不稳定可能无法正常访问”,你可能会非常着急。而对于不是特别了解搜索行业风控机制的人来说,甚至还会怒问百度:“你为什么要给我打上这个标签?”
gydtep
发表于 2022-1-5 15:46:11
通过提供可视化干预能力满足用户二次迭代的需求,并通过将工程链路内置到 imgcook 平台实现一站式开发、调试、预览和发布来提升整体的工程效率。再加上支持自定义 DSL、自定义开发物料等扩展性很强的自定义能力形成的开放体系一起构成了整个 D2C 架构,服务于阿里内部 C 端、小程序、中后台等以及外部社区各种不同的业务场景。
gydtep
发表于 2022-1-7 19:45:59
十年前,Google成为了分布式系统链路追踪服务的先行者,并通过《Dapper, a Large-Scale Distributed Systems Tracing Infrastructure》这篇著名论文阐述了如何在超大规模系统上建设低损耗(low overhead)、应用级透明(application-level transparency)、大范围部署(ubiquitous deployment)的链路追踪服务。
gydtep
发表于 2022-1-10 12:27:07
创建数据集的过程是多部分的-从经常收集多年的数据开始,工程师将需要确定数据的总体结构。他们需要消除数据中的任何缺陷、差异或差距,然后将这些数据转换为算法需要与之进行有效交互的形式。
gydtep
发表于 2022-1-14 15:40:54
值得一提的是,ACNA 除了是一个架构设计方法,也包含了对云原生架构的评估体系、成熟度衡量体系、行业应用最佳实践、技术和产品体系、架构原则、实施指导等。
gydtep
发表于 2022-1-17 16:44:08
在实际进行灰度时,每个节点实现灰度的方式可能不同。比如,商家需要修改DB数据,而会员节点除了需要修改DB数据外,还需要修改对应节点中的缓存。需要注意的是,无论每个节点如何进行具体的灰度操作,各个节点间需要实现灰度的同进同退。
页:
1
2
[3]
4
5
6
7
8
9
10
11
12