gydtep 发表于 2020-8-17 14:45:39
但是,overlayfs 要到2010年才首次提交 patchset,2014年才被合并到 3.18内核(这中间,当时的淘宝内核组也有不少贡献和踩坑呢)。gydtep 发表于 2020-8-17 17:01:07
都并没有选择 cloop 文件,它们选择了和应用语义更接近的文件系统级的解决方案——Squashfs。Squashfs 压缩了文件、inode 和目录,并支持从 4K 到 1M 的压缩单元尺寸。gydtep 发表于 2020-8-17 20:21:01
reading a compressed block may thus bring in more than one file into the cache. The effects of tail packing are known to improve seek times (cf. reiserfs, btrfs), especially for small files. Some performance tests related to cloop have been conducted.gydtep 发表于 2020-8-17 22:13:37
当然,尽管有这些争论,cloop 也仍然在 Knoppix 上存在,不过,这个争论最终随着2009年 squashfs 被并入 2.6.29 主线内核,应该算是分出胜负了,gydtep 发表于 2020-8-17 22:32:10
这样,那些支持 tail packing 的文件系统(比如 reiserfs,btrfs)可能可以显著改善 seek 操作的时间,尤其是对于小文件更是如此。已经有一些与 cloop 相关的性能测试也证明了这些观点。gydtep 发表于 2020-8-18 09:51:00
这个完整的操作系统都是不可变的,就像 Live CD 一样,我们叫它镜像,可以用 aufs 这样的 union FS 在上面放一个可写层,应用可以在运行时写东西到可写层,一些动态生成的配置也可以放在可写层;gydtep 发表于 2020-8-18 10:41:05
是的,蚂蚁的镜像加速实践里就采取了这样的架构。在过去,庞大的镜像不仅让拉取过程变慢,而且如果这一过程同样风险重重,贡献了大半的 Pod 启动失败率,gydtep 发表于 2020-8-18 13:18:19
对于 Kata 这样的虚拟化容器,镜像数据直接送给 Pod 沙箱内部使用,不加载在宿主机上;gydtep 发表于 2020-8-18 15:15:46
HDFS全称叫做Hadoop分布式文件系统,其主要由一个NameNode(NN)和多个DataNode(DN)组成,数据文件会分成多个Block,这些Block按照不同主机,不同机架的策略以默认一备三的情况分布存储在各个节点。gydtep 发表于 2020-8-18 18:45:36
一款用于在传统关系型数据库和HDFS之间互相进行数据传递的工具,无论是import还是export都提供了大量的参数,因为是分布式执行,数据传输的速度也非常快。