上海交通大学新兴并行计算研究中心与阿里云操作系统团队合作的论文“Spool: Reliable Virtualized NVMe Storage Pool in Public Cloud Infrastructure”被操作系统领域顶级国际会议2020 USENIX Annual TechnicalConference(USENIX ATC'20)录用为长论文。该论文提出的NVMe虚拟化系统Spool,专注于解决本地SSD型实例存储服务的可靠性,以2.97%的性能损失,减少94%的数据丢失和90.58%的启动时间。
确保虚拟化NVMe存储系统的高可靠和高可用,对于大规模云至关重要。然而,以前的I/O虚拟化系统只注重提高I/O性能,而忽略了上述挑战。为此,我们提出了Spool,一个全链路可靠的NVMe虚拟化系统。
Spool有三个主要优点。(1) Spool对NVMe设备进行故障诊断,仅对介质故障的磁盘进行热插拔替换,其他故障类型的磁盘通过重置磁盘控制器来处理,减少了由于不必要的磁盘更换而造成的数据丢失。(2) Spool确保在重置控制器和热升级时的数据一致性和正确性。(3) Spool大大缩短了NVMe虚拟化系统的重启时间。快速重启减少了在热升级和故障恢复期间由于服务不可用时间。我们的实验表明,Spool提供了可靠的存储服务,性能损失小于2.97%,与SPDK相比减少了90.58%的重启时间。
USENIX ATC由USENIX协会创办于1992年,是计算机系统领域顶级会议(CCF A)类会议,该会今年录用了65篇论文,录用率为18.6%。