gydtep
发表于 2021-11-12 06:54:26
在人工代码评审(Code Review,CR)中,对于纯文本形式的代码浏览不可避免地将耗费大量的时间,影响CR的效率。那么有没有更智能的方法?阿里云云效代码智能语法服务基于云端备份的快速代码导航服务,无须本地克隆即可在页面体验熟悉的定义引用快速查看跳转功能,可大幅提升代码评审的效率和质量。本文分享相关的技术原理与实现方法。
gydtep
发表于 2021-11-12 08:20:48
朱熹老先生常说“心不在此,则眼不看仔细,心眼既不专一,却只漫浪诵读,决不能记,记亦不能久也。”代码文本扁平式地漫浪诵读只能达到眼到、口到的境界
gydtep
发表于 2021-11-12 14:24:29
开发期间修复并适配了一些lsif-java的问题,如位置范围信息错乱,召回多种遗漏的高亮词类型,适配非Maven仓库的索引构建。同时还修复了Spoon关于无法正确解析注释中的部分注解的问题,PR已被Spoon社区接受合并。
gydtep
发表于 2021-11-13 06:24:29
DevOps的挑战
对于应用交付的整个流程而言,通常会涉及三个环节,即开发、测试和运维,而在传统的组织架构中,他们对应的也往往是三个不同的团队。这三个环节各自有自己的侧重点,但是在实际上,想要让整个应用交付过程变得顺滑高效,并且让应用在上线后保持高可用的状态,往往需要三个团队将相互之间存在的墙打破掉。
gydtep
发表于 2021-11-14 07:22:42
Shard Request Cache:针对 ES 的 query 请求,缓存各分片的查询结果,主要用于缓存聚合结果,采用LRU机制,当分片 refresh 后会失效。
gydtep
发表于 2021-11-14 08:30:58
对于 lucene 而言,其使用的是堆外内存
• Page Cache:lucene 读写段文件时会依赖操作系统的 page cache 缓存,如果多次查询都涉及到读取某个段文件的同一部分内容,就直接使用 page cache 进行读取,无需再从磁盘获取数据。page cahce 由操作系统管理,淘汰策略类似LRU。
gydtep
发表于 2021-11-14 09:37:41
上述文件中占用存储空间较多的是 tim、doc、fdt、dvd 以及 cfs 这几类数据文件,除 cfs 以外的几类文件加载情况和查询条件密切相关;
gydtep
发表于 2021-11-15 10:21:41
RNN Noise是一种基于传统算法改进的混合方法。整个算法为了保证实时性,训练特征主要以传统信号的特征为主,(涉及bark域的能量和pitch域的相关能量系数、pitch_index的值、带噪语音bark域的能量和带噪语音bark域倒谱相关的信息),一共42个
gydtep
发表于 2021-11-15 15:43:14
最终得出期望的时频域上的先验信噪比。除此之外,我还进行了去除seq_len,添加highpass,更改数据混合方式,调整训练集中的噪声分布等改进项,从不同角度提升模型的训练效果
gydtep
发表于 2021-11-15 16:48:51
我们看一下算法效果,客观指标主要通过PESQ语音质量与STOI语音可懂度来衡量,我们构建了ali_test_datasets,含有1w多条带噪语音,涵盖街道、咖啡馆等日常环境,分为四个子测试集,_itu表示数据集中的纯净语音为itu标准测试序列,