Checksum-Based存储实现
以下部分提供了更多关于如何在Artifactory中实现基于校验和的存储特性的信息。
重复数据删除
Artifactory只存储任何二进制文件一次。这就是我们所说的“一次性存储”。第一次上传文件时,当存储文件时,Artifactory运行所需的校验和计算,然而,如果文件再次上传(例如,到不同的位置),则上传被实现为一个简单的数据库事务,它创建了另一个记录,将文件的校验和映射到它的新位置。实际上不需要在存储中再次存储文件。无论一个文件被上传多少次,文件存储都只存储该文件的一个副本。
复制和移动文件
复制和移动文件通过简单地添加和删除数据库引用来实现,相应地,这些操作的性能就是数据库事务的性能。
删除文件
删除文件也是一个简单的数据库事务,其中相应的数据库记录将被删除。即使删除了指向该文件的最后一个数据库条目,也不会直接删除该文件本身。所谓的“孤立”文件被Artifactory的垃圾收集过程在后台删除。
上传、下载和复制
在将文件从一个位置移动到另一个位置之前,Artifactory会发送校验和头。如果文件已经存在于目标中,那么即使它们存在于不同的路径下,也不会传输它们。
文件系统性能
文件系统性能大大提高,因为文件存储上的操作是作为数据库事务实现的,因此永远不需要对文件系统执行写锁。
校验和搜索
通过校验和搜索文件是非常快的,因为Artifactory实际上是在数据库中搜索指定的校验和。
灵活的布局
由于数据库是文件存储和显示布局之间的一个间接层,所以可以支持任何布局,无论是标准的打包格式,如Maven1, Maven2, npm, NuGet等,还是任何自定义布局。