JLU-ICS 关于存储系统的研究成果被JSA接收

实验室存储系统方向工作“Crash Consistency in an NVM-enabled Hybrid Storage System: Problems, Solutions, and Verification”被CCF-B类期刊The Journal of Systems Architecture: Embedded Software Design (JSA) 接收。该论文第一作者为吉林大学博士生王国毓,通讯作者为吉林大学副教授胡俊成,其他合作者包括吉林大学25级博士生裴辰举、助理研究员吕克敌、教授车喜龙以及东北师范大学博士后李腾飞。本文为实验室FAST’25工作的一个补充性工作,该论文对混合介质文件系统面临的数个一致性问题进行了讨论和解决,并使用模型检查方法验证了提出的方案。

研究背景

崩溃一致性是存储系统设计中的核心问题之一。即便在仅包含单一存储介质的系统中,如传统磁盘文件系统或 NVM 文件系统,其一致性机制本身就已相当复杂。而在混合介质文件系统中,多种异构存储介质并存,使得系统状态更加多样,对崩溃一致性机制的设计提出了更高要求。基于此,本文重点关注一种被称为 Sync-triggered Selective Absorption(SA)的高性能混合存储系统设计范式,系统分析并总结了该类混合介质文件系统所面临的若干关键一致性问题。

研究内容

我们发现,混合介质文件系统在崩溃一致性方面主要面临三类挑战:

  1. 写入顺序问题(Write Ordering):同步写入 NVM 与后台写回磁盘可能以任意顺序交错发生。在崩溃恢复时,到底该相信 NVM 还是磁盘中的数据,并不是显而易见的。
  2. 写入粒度问题(Write Granularity):NVM 支持字节级写入,而磁盘通常以页为单位管理数据。当 NVM 中只记录了“部分更新”,而磁盘中保存的是“整页数据”时,如何在恢复阶段重建用户期望的最终数据状态?
  3. 并行写入问题(Parallel Write):NVM 可由 CPU 直接访问,而磁盘写入通常通过 DMA 异步完成。这两条写路径在时间上的并行性,会进一步放大前两类问题的复杂度。为分析上述问题,本文首先提出一种基于“执行序列”的文件系统形式化建模方法,并基于该方法对同步操作的崩溃一致性提出了两项形式化规范,分别称为“存在性”和“保序性”。

进一步地,文章基于上述形式化方法对写入顺序问题、写入粒度问题和并行写入问题进行了讨论,并逐步地给出了在SA系统设计范式下针对各项问题的解决算法。通过文章给出的一致性解决方案,SA类型混合介质文件系统能够以更激进的方式在不同介质间调度数据,相比于朴素的、不考虑上述一致性方案的混合介质文件系统设计能够提升高达2倍的性能。文章同时还使用模型检查方法对提出的算法进行了正确性验证。该成果受到国家重点研发计划(2024YFB3310202)和吉林省重点研发计划(20250201076GX)的支持。

Journal of Systems Architecture: Embedded Software Design,简称 JSA,是一本涵盖嵌入式系统与软件相关的所有设计与体系结构方面内容的学术期刊。其研究范围从微体系结构层面,经由系统软件层面,一直到面向特定应用的体系结构层面。期刊关注的主题包括但不限于:实时系统、操作系统、编程语言、通信(限于分析与软件协议栈)、移动系统、并行与分布式体系结构,以及计算机与系统体系结构领域中的其他相关主题。