2025

ICS Lab

2025

ICS Lab 研究成果被Euro-Par2025接收

2025-07-01

实验室量子计算方向工作被Euro-Par2025（CCF B类）接收，论文题目为“Quantum Delta Encoding: Optimizing DataStorage on Quantum Computers with Resource Eficiency”。本次Euro-Par25共收到264篇投稿，最终录用78篇论文，录用率为29.5%。该论文提出了一种名为**Quantum Delta Encoding (QDE)**的创新性框架，通过结合经典Delta编码和量子基态编码，显著优化了量子数据存储的资源效率，为量子计算中的数据处理提供了全新解决方案。该论文第一作者为实验室2022级博士张嘉乐，通讯作者为实验室负责人胡俊成老师，主要合作者包括实验室2024级硕士樊宇哲和吉林大学车喜龙教授。研究背景随着信息技术的迅猛发展，数据量的爆炸式增长对存储和处理能力提出了巨大挑战。传统经典压缩算法在处理大规模数据集时，往往需要O(N)比特的存储空间，难以满足实时处理需求。量子计算凭借其独特的并行性和纠缠特性，为高效数据存储和处理开辟了新路径。然而，现有量子数据编码方法依赖复杂的多量子比特控制非门（CNOT），导致量子资源消耗高、电路分解复杂，且在噪声中间尺度量子（NISQ）设备上鲁棒性不足。如何在保证无损数据恢复的同时，降低量子比特和量子门的使用，成为亟待解决的难题。实验设计如图1所示，QDE受经典Delta编码启发，提出了一种资源高效的无损量子数据编码模型。QDE通过设定一个基准值γ，将数据集的大部分信息存储在非纠缠寄存器中，仅对偏差值δ通过纠缠进行编码，从而显著减少纠缠量子比特和量子门的需求。QDE的核心设计包括：基准存储：使用简单的量子X门存储基准值γ，无需纠缠资源。偏差编码：通过H门和多量子比特控制非门（CNOT）对偏差值δ和位置索引i进行纠缠编码，生成QDE状态|QDE⟩。3.QRAM兼容性：QDE状态可直接与量子随机存取存储器（QRAM）集成，支持后续量子数据处理任务，如图像处理和数据加密。理论分析表明，对于大小为2ⁿ×2ⁿ的数据集，QDE仅需log N + log k + 1个纠缠量子比特（k为最大偏差δ的比特数），远低于现有模型。此外，QDE将运行时复杂度从O(n·2²ⁿ)优化至最优情况下的O(n)，展现出显著的资源效率优势。实验结果文章的实验部分在IBM Quantum平台的模拟器（qasm）以及两台超导量子计算机（ibm_sherbrooke和ibm_kyiv）上进行了验证。实验结果表明：存储效率：在存储4元素数据集（如{2024, 2025, 2026, 2027}）时，QDE仅需4个量子比特，量子电路构造仅涉及3个H门和4个CNOT门，远低于传统方法。噪声鲁棒性：QDE对相位移噪声表现出较强的鲁棒性，相较于BRQI和PE-NGQR等模型，QDE状态在噪声影响下的保真度下降速率更慢。图像处理能力：在2×2彩色图像上，QDE支持R、B通道交换和水平翻转等操作，时间复杂度从O(n²)优化至接近常数级别，实验结果在模拟器（50,000次采样）和真实量子硬件（20,000次采样）上均与理论状态一致。真实数据集测试：在纽约证券交易所开盘价、摩洛哥电力消耗和美国沃尔玛价格指数等数据集上，QDE的量子比特消耗低至10-12个，优于经典Delta编码及其他量子模型。 QDE通过创新性地结合经典Delta编码与量子基态编码，不仅实现了量子数据存储的资源优化，还为量子图像处理和数据加密等后续任务提供了高效支持。实验结果验证了QDE在NISQ设备上的适用性和噪声鲁棒性。未来，实验室将进一步探索QDE在量子机器学习和量子通信中的应用潜力。论文代码和数据已开源，欢迎访问： https://github.com/kennyZhangsky/Quantum-Delta-Encoding Euro-Par25 全称为The 31st European Conference on Parallel and Distributed Computing，涵盖并行和分布式处理的各个方面，涵盖从理论到实践、从小型到大型并行和分布式系统及基础设施、从基础计算问题到应用、从架构、编译器、语言和接口设计与实现，到工具、支持基础设施以及应用程序性能等各个方面。Euro-Par 的参与者来自学术机构、政府实验室和工业组织的研究人员。Euro-Par 旨在成为这些专业人士在其特定领域展示新成果的首选平台。Euro-Par 为集中技术讨论以及与众多、广泛且多元化的受众互动提供了一个绝佳的平台。

ICS Lab 研究成果被ACM Transactions on Storage接收

2025-05-07

实验室分布式存储安全方向工作被 CCF A类期刊ACM Transactions on Storage 接收，论文题目为“BLA: Byzantine-Tolerant Lazy Auditing Framework for Decentralized Storage Data Integrity”。本文提出了一种名为BLA的远程数据完整性审计框架，通过结合区组设计策略与分层架构，在去中心化存储场景中实现了支持拜占庭容错的高效数据完整性审计。该论文的第一作者为东北师范大学李腾飞博士，通信作者为吉林大学讲师胡俊成，共同通信作者为东北师范大学信息科学与技术学院殷明浩教授。研究背景随着区块链技术的发展，去中心化存储成为一种有前景的模型，具有开放公平访问、减少对中介依赖和强隐私保护等特性。但与中心化存储一样，去中心化存储也面临数据所有权和控制权分离以及外部管理数据完整性审计的挑战。现有的集中式审计模型不能直接用于去中心化存储环境，基于同态验证标签（HVT）的审计模型也存在计算成本高和审计过程效率低等问题。实验设计图1 如图1所示，我们以(7,3,1)—design为例，将用户数据以冗余形式分别存储至各存储节点。如图2所示，当进行完整性审计时，我们使用PBFT协议中的思想并进行简化，通过对存储网络进行分层，并添加懒审计的思想实现分布式存储节点间的协同审计。图2 实验结果为了近似模拟现实世界中的场景，我们在共识层选择了两种设置：f=1和f=2，分别模拟在由4个集群组成的系统中1个节点失效和在由7个集群组成的系统中2个节点失效的最坏情况。此外，在所有未发生故障的节点中，我们最大限度地减少了数据损坏的节点数量。通过这种设置，我们可以测试系统在重大节点故障和数据损坏情况下的恢复能力，确保我们的解决方案即使在不利情况下也能保持数据完整性和运行可靠性。每个云产品中存储集群内部的区组设计配置（设置1：f=1，即3f+1=4）云产品区组设计存储节点数每节点组件数失效损坏 ECS1 (7,3,1)-design 7 3 √ - ECS2 (7,3,1)-design 7 3 × √ CVM (13,4,1)-design 13 4 × × BCC (31,6,1)-design 31 6 × × 每个云产品中存储集群内部的区组设计配置（设置2：f=2，即3f+1=7）云产品区组设计存储节点数每节点组件数失效损坏 ECS1 (7,3,1)-design 7 3 √ - ECS2 (7,3,1)-design 7 3 × √ ECS3 (7,3,1)-design 7 3 × × CVM1 (13,4,1)-design 13 4 √ - CVM2 (13,4,1)-design 13 4 × √ CVM3 (13,4,1)-design 13 4 × × BCC (31,6,1)-design 31 6 × × 为了更直观地比较它们的通信开销及其随系统节点数的变化情况，我们将每个集群内的节点数量标准化。图3描述了 PBFT 和 BLA（ d分别配置为 3、4 和 5）中通信开销随节点数变化的进展情况。如图3所示，随着系统节点数的增加，PBFT 的通信复杂度急剧上升，仅 28 个节点就达到了 1512。与此形成鲜明对比的是，代表 BLA 的三条线的增长速度要慢得多，而且它们之间的差异微乎其微。这种差异凸显了 BLA 在管理通信开销方面比 PBFT 更优越的可扩展性和效率，尤其是当网络规模变大时。图3 ACM Transactions on Storage是发表数据存储研究与实践进展的顶级期刊，据不完全统计，本工作为吉林省首篇在该期刊上发表的科研论文。存储系统对于管理世界上的数据至关重要，并推动计算技术的进步。存储是一个广泛、不断演变且多学科的领域，设计、开发和部署存储系统仍然具有挑战，因为软件和硬件的变化、新的更复杂的工作负载、指数级的数据增长以及性能、成本、可靠性和安全性的相互冲突都对其有深刻影响。

ICS Lab 研究成果被IJCAI 2025接收

2025-05-04

实验室在多标签因果特征选择方向的研究工作被人工智能领域国际顶级会议IJCAI 2025（CCF A类）录用，论文题目为“MCF-Spouse: A Multi-label Causal Feature Selection Method With Optimal Spouses Discovery”。本次IJCAI共收到5404篇投稿（不含desk reject），最终录用1042篇，接收率为19.3%。该论文第一作者为实验室2023级博士生马琳，通讯作者为吉林大学讲师胡俊成，主要合作者包括MBZUAI博士后黄强和东北师范大学讲师郝娉婷。研究背景在现实世界的诸多应用场景中，如文本多标签分类、图像多目标识别、生物医学疾病预测等，每个样本往往对应多个相关联的标签。这类问题被统称为多标签学习（Multi-label Learning），其关键挑战之一是如何在特征空间中选择对多个标签都具有影响的信息。然而，传统的特征选择方法忽略了标签之间潜在的因果依赖关系，影响模型的泛化性能与可解释性。近年来，因果发现方法逐渐引入到特征选择中，因果特征选择（Causal Feature Selection）开始被研究者关注。虽然已有方法在单标签场景下取得一定成果，但其在多标签场景下的适应性仍面临挑战：标签之间的因果结构更复杂，即存在特征-标签，特征-特征，标签-标签之间的因果结构；单独对每个标签建模容易产生特征冗余或遗漏；多标签场景下因果发现的“忠实性”假设不再成立，即存在多个等价信息；配偶节点的发现过程容易导致大量冗余的条件独立性测试（Conditional Independence tests，CI tests）。为解决上述问题，我们提出了一种新型的多标签因果特征选择方法——MCF-Spouse。该方法使用互信息比较标签与特征节点对目标节点的贡献度，以此解决等价信息问题，并通过对节点的“V-structure”分析讨论，发现多标签场景下，需要保存的配偶形式，大幅缩短配偶发现所需要的条件独立性测试数量。实验设计第一阶段：PC（父子节点）发现。本阶段采用HITON-PC算法进行目标标签Li的候选PC集CPC的发现，如算法第3行所示。HITON-PC在减少假阳性和假阴性方面表现优异，能够有效提升因果结构发现的准确性。第二阶段：恢复由标签相关性过强被阻塞的特征。由于多标签间存在强相关性以及等价信息问题，某些重要特征可能在第一阶段中未被选入Li的CPC。为此，算法第5–10行重新评估了这些被忽略的特征。具体来说：第5–7行：如果特征Fj不在Li的CPC中，则说明其可能因其他标签而被阻断。第8–10行：通过判断Fj与标签Yi是否独立，构建得分序列Fere。从中选取前k1%的特征，作为最有可能被忽略的重要特征。算法第11–17行进一步识别阻断路径：第11–14行：若在不包含标签Lk的条件下，特征Fj与标签Li依赖，而一旦加入Lk后两者变得独立，则说明Lk阻断了Fj→Li的路径。第15–17行：通过比较互信息I(Li;Fj)与I(Li;Lk)，我们量化两者对Li的贡献度。若Fj贡献更大，则纳入Li的CPC；反之，保留Lk。第三阶段：配偶节点发现。配偶节点的识别依赖于V结构，根据论文中第三章的讨论，最优的配偶节点仅可能在即Li→Fj←Fk结构中出现。第19–21行：遍历Li的候选PC集中的每个特征Fj。第22–23行：若Fj 同时也是其他特征的PC，则可能为碰撞节点。第24行：候选配偶节点集合为所有不在Li的CPC中的特征。第25行：若将Fj作为条件变量后，发现某特征Fk与Li 产生依赖，说明三者构成V结构，Fk即为Li的配偶节点。实验结果在本实验中，我们将所提出的MCF-Spouse方法与9种多标签方法进行了对比。采用ML-kNN进行评估，最近邻数k设置为10。我们选取了八个来自不同实际应用领域的多标签数据集，分别为：所有数据可从多标签分类数据集库中下载：http://www.uco.es/kdis/mllresources/#3sourcesDesc 。我们选用以下四项常见的多标签特征选择指标来评估特征子集的性能： Hamming Loss（越小越好），Ranking Loss（越小越好），F-micro（越大越好），F-macro（越大越好）。结果分析：图1 从图1可见，MCF-Spouse方法通过引入配偶变量搜索机制，相较于未考虑配偶变量的MB-MCF和M2LC，选取了更多的相关特征，从而在四个数据集的所有指标上实现了显著性能提升。这表明，配偶变量在提升模型预测能力和准确性中起到了关键作用。与通过逐步调整特征比例（每次1%）来寻优的非BN方法相比，MCF-Spouse不仅在大多数数据集上表现更优（仅在VirusGO上F-macro稍弱），而且具有更强的稳定性和更高的效率。相反，非BN方法通常表现不稳定，且需要大量时间完成搜索。图2 为了进一步验证MCF-Spouse在不同指标和数据集上的稳定性，我们将各方法结果归一化到[0,0.5]区间，并赋值最优方法为0.5。对于HammingLoss等越小越优的指标，归一化最小值为0.5；对于F-Macro等越大越优的指标，归一化最大值为0.5。如图2所示，MCF-Spouse呈现出近似正八边形的表现，说明其在多个数据集和多个指标下均具有稳定性。运行时间分析：我们在Flags与Image数据集上对这10种算法进行了运行时间评估，计时从算法开始执行到使用ML-kNN完成分类为止。为保证公平性，对于非BN类方法，我们将运行时间取其在1%到20%特征比例下的平均值。如表所示，MCF-Spouse在运行效率上表现优越。在Flags数据集上，其运行时间与MCMFS、ENM相当；而在更大的Image数据集上，相较于MB-MCF、MCMFS等方法，MCF-Spouse显著缩短了运行时间。这表明MCF-Spouse能在保持高质量特征选择的同时，兼顾计算效率，适用于高维复杂任务。 IJCAI 2025全称为The 34th International Joint Conference on Artificial Intelligence，将于2025年8月16日至22日在加拿大蒙特利尔举行。IJCAI是人工智能领域最具影响力的国际会议之一，与 AAAI+ 和 NeurIPS 并列，是发表人工智能领域前沿研究的重要平台，也是中国计算机学会（CCF）推荐的A类国际学术会议。会议内容涵盖了人工智能理论与架构、机器学习、自然语言处理、计算机视觉、机器人科学等几乎人工智能的所有核心领域。

ICS Lab 研究成果被JSA接收

2025-01-21

实验室存内计算方向工作被SCI检索的国际期刊JSA（Journal of Systems Architecture）接收，该期刊属于CCF B类/中科院2区。论文第一作者为胡俊成博士，通讯作者为车喜龙教授。其他合作者包括22级硕士生陈硕、23级硕士生魏皓阳、21级博士生王国毓、吉林大学计算机科学与技术学院21级本科生裴辰举。本论文提出的StorStack 是一个全栈、高度可配置的存储文件系统框架和模拟器，在确保了可靠性、灵活性和兼容性基础上，实现了性能优化。研究背景数据移动的成本日益提高，存内计算（In-storage Computing）在学术界引起了相当大的关注。虽然大多数存内计算研究允许直接处理数据，但这些方法并不能完全消除 CPU 在文件访问过程中的参与，数据仍然需要从文件系统移动到内存中进行处理。尽管有人尝试将文件系统放入存储设备中来解决这一问题，但由于绕过了内核且缺乏页面缓存，在面对高延迟存储设备时，系统的性能并不理想。为解决上述问题，我们提出了StorStack，一个全栈、高度可配置的存储文件系统框架和模拟器，以促进架构和系统级研究。通过将文件系统卸载到存储设备中，文件系统可以更接近数据，减少数据移动的开销。同时，它还避免了内核陷阱，减少了通信开销。更重要的是，这种设计使存储计算应用完全不需要 CPU 的参与。StorStack 还设计了用户级缓存，以便在存储设备访问延迟较高时保持性能。实验设计本文提出的StorStack设计包括三个主要组成部分，分别部署在主机端和设备端，如图1所示。主机端包括用户空间的用户库U-lib和内核空间的内核驱动模块K-lib，设备端包括文件系统运行时环境Firm-RT。并将工作流程分成数据平面（红色）和控制平面（蓝色），分别负责用户数据访问和系统功能的维护、可靠性及安全性保障。图1 虽然我们的设计位于存储设备，但与一般的Firm-FS不同，我们实现了文件系统与存储设备的解耦。文件系统会动态地加载到Firm-RT上，并可根据用户需求选择不同的文件系统，从而实现了文件系统的可替换功能。这种组织方式如图2所示。图2 为了确保文件系统的基本保障（如权限检查等），StorStack将控制平面置于可信区域中。与此同时，为了提升系统性能，本文提出了一种令牌机制，以避免在数据平面访问过程中，StorStack不必要地进入内核空间，进而减少内核陷阱的开销。具体工作流程如下图。图3 实验结果StorStack的主机端和设备端都运行在Linux 5.15上，Firm-RT由QEMU及其主机上运行的系统模拟实现。本文测试了StorStack在不同设置下的表现，涵盖不同的缓存选项、设备访问延迟、线程数量和读写比例等因素。具体表现如下：随机读写测试：图4 绕过内核的性能提升：图5 延迟的影响：图6 多线程性能：图7 JSA全称Journal of Systems Architecture，是被SCI检索的国际期刊，同时也是中国计算机学会（CCF）推荐国际学术刊物（计算机体系结构/并行与分布式计算/存储系统）B类。其范围从微体系结构级、系统软件级直至特定应用体系结构级。实时系统、操作系统、编程语言、通信（仅限于分析和软件栈）、移动系统、并行和分布式架构等方面以及计算机和系统架构领域的其他主题都属于本期刊的范围。