gydtep
发表于 2020-8-4 11:08:59
当模型的时效性比较强的时候,我们还需要不断的使用新的数据更新模型,就是“增量训练“,这样每次增量训练就不得不再次从头走一次完整的流程。
gydtep
发表于 2020-8-4 13:44:30
另外从需求到上线,为了保证线上服务和数据产出的稳定,也需要通过许多的步骤。
gydtep
发表于 2020-8-4 15:35:01
在描述模型训练任务时,使用 SQLFlowSQL 只需要编写 SELECT * FROM iris.train TO TRAIN DNNClassifier LABEL class INTO my_dnn_model; 即可,如果使用Python完成相同的任务则需要编写如下图这样的较长的代码。
gydtep
发表于 2020-8-4 17:46:57
;算法同学可以更加专注于提升模型效果、开发、更新模型的工作上面。这样不仅可以减少沟通成本,也可以提升工作成果的复用能力。
gydtep
发表于 2020-8-4 19:00:48
该模型将输入的时间序列数据自动的提取不同时间窗口的周期性特征构建模可以获得比较好的结果。
gydtep
发表于 2020-8-5 07:59:46
之所以选择容器技术,是因为完美日记要构建一套现代化IT系统以满足快速变化的需求和挖掘更多的数据价值。
gydtep
发表于 2020-8-5 10:25:15
我们没遇到的问题,他们也都遇到过,站在巨人的肩膀上进行容器化改造,对于当下的完美日记而言,是最合适的。
gydtep
发表于 2020-8-5 12:55:45
2019年12月中,尝试将后台正式环境切换到K8s正式环境中,但由于UAT环境中代码版本和正式环境中代码版本不一致,导致第一次尝试切换失败。
gydtep
发表于 2020-8-5 14:11:19
3月下旬,前端开始迁移,4月初前端基本迁移完成。最终在4月中旬,完美日记IT系统全部迁移完成。
至此,完美日记全面容器化改造完成。
gydtep
发表于 2020-8-5 15:11:55
另外,镜像企业版并发比自建harbor要高,如果大批量进行扩容,自建harbor往往容易出镜像PULL问题,但是镜像企业版就没有这种担忧。