2025

ICS Lab
JLU-ICS 关于可信人工智能的研究成果被ESWA接收
实验室可信人工智能方向工作“Enhancing Fairness in Decision-Making of Natural Language Understanding Systems: An Intersectional Bias Debiasing Model via Information Theory-based Disentanglement”被中科院SCI一区期刊Expert Systems With Applications接收。该论文第一作者为吉林大学助理研究员李莹姬,通讯作者为吉林大学副教授胡俊成,其他合作者包括吉林大学助理研究员宋瑞和教授胡亮。该论文提出了一种基于信息论解缠的交叉偏见去偏模型IBDM,通过将交叉偏见的指数级复杂度降至线性级,并结合变分自编码器与随机反事实数据增强,有效缓解预训练语言模型中的交叉偏见问题。 研究背景在预训练语言模型(PLMs)社会偏见缓解研究中,现有方法多针对单一偏见进行设计与评估,普遍忽视跨多个人口群体的交叉偏见问题。然而,偏见方向的非线性组合使得现有去偏方法难以有效推广到交叉场景,并导致计算复杂度呈指数级增长。 为此,本文提出一种基于信息论的解纠缠交叉偏见去偏模型(IBDM),通过对 PLMs 编码的表征进行信息解纠缠,缓解交叉偏见并提升下游任务的决策公平性。 具体而言,我们利用不同人口群体间的独立性假设,将去偏过程的计算复杂度从指数级降低至线性级,并基于变分自编码器解耦公平表征与多个单一偏见表征,在任务标签与敏感属性标签的共同约束下进行学习。同时,引入随机反事实数据增强策略,以进一步提升公平表征的准确性与稳定性。 实验设计在实验部分,我们将通过探究以下问题来展示IBDM的实际表现:Q1:在下游任务中,IBDM在准确性与公平性的权衡方面表现如何?Q2:IBDM对公平表征与偏见表征的有效解纠缠程度如何?Q3:IBDM中的各个组成部分分别起到什么作用?Q4:独立性假设如何影响IBDM的去偏性能? 实验结果Q1:去偏性能分析。我们评估了IBDM在下游任务中的去偏能力并展示了具体的去偏示例。结果表明,IBDM 能有效减少交叉偏见,同时保持了下游任务的预测性能。 Q2:表征解纠缠分析。我们进行了定性和定量分析,以评估在 IBDM 所采用的解纠缠策略的有效性。实验证实了IBDM 能够成功地将与任务相关表征与偏见相关表征区分开来,验证了我们所采用的信息论框架。 Q3:消融研究。我们在三个下游任务上进行了消融实验。实验表明,所有变体在不同程度上影响了 IBDM 的公平性和准确性。每个组成部分对于去偏和下游任务都至关重要,其中 RCDA 特别有助于提高解耦的稳定性。 Q4:独立性假设的敏感性分析。我们通过进行一项有控制的敏感性分析来研究独立性假设如何影响 IBDM 的去偏效果。结果显示,当敏感属性之间的依赖性增强时,去偏效果会减弱。但 IBDM 在轻微至中度的偏见情况下仍保持相对稳定,而且即使在独立性假设明显被违背的情况下,其表现也依然优于基准模型。该成果受到国家重点研发计划(2024YFB3310200)、吉林省教育厅(JJKH20261301KJ)和博士后科学基金(2024M761122)的资助。 Expert Systems With Applications(ESWA)是爱思唯尔旗下专注于人工智能与智能系统应用的国际权威期刊(2024年影响因子7.5,中科院SCI一区,JCR一区)。该刊强调理论结合实践,聚焦机器学习、智能决策等前沿技术在工程、医疗、金融等领域的创新应用。其审稿标准严格,要求研究兼具算法创新与充分的实证验证,是国际学界公认的高水平应用人工智能研究成果发表平台。

Read More
JLU-ICS 教师参加第七届中国计算机教育大会并荣获实验教学案例特等奖
2025年11月28日至30日,以 “新智能・新范式・新时代”为主题的第七届中国计算机教育大会(CECC)在厦门国际会议中心正式开幕。本届大会紧扣人工智能快速发展的时代背景,深入贯彻二十届四中全会精神、响应国家人工智能创新发展战略部署,汇聚了百余位学术界、教育界与产业界知名专家学者,围绕计算机教育变革路径与未来发展大计展开研讨,致力于通过深化产教融合、革新教育范式、拓展国际视野等途径,为构建高质量人才培养体系、助力新质生产力发展注入动能。大会由教育部四大计算机相关教指委联合主办,多所厦门本地高校及麦思博公司共同承办,还获得了多家知名出版社、专业委员会的协办以及华为、阿里云等企业的支持。 在本届大会计算机类教学和实验案例成果的评选中,依托实验室教学团队多年在《计算机网络》理论课和《网络协议》、《IPv6技术与实践》等实践课程的深耕,由实验室负责人胡俊成老师牵头打造的《IPv6 路由的全场景构建与互通实验》实验教学案例,在近400项计算机类教学与实验案例的激烈角逐中脱颖而出,成功入选优秀案例库并一举获评特等奖,尽显团队在计算机实验教学领域的深厚积淀与顶尖实力,团队另外提交的《外部网关路由协议BGPv4:基于国产基础设施构建AS间路由选择》也获得了教学案例一等奖的好成绩。 《IPv6 路由的全场景构建与互通实验》案例针对传统路由实验内容陈旧、缺乏跨域互联实践且未融入信创技术的痛点,依托华为国产 eNSP 仿真平台,以跨自治系统(AS)IPv6 通信为核心,设计了三大核心任务: 完成 IPv6 接口地址规划与连通性验证; 部署 OSPFv3 实现 AS 内 IPv6 动态路由; 配置 BGP 协议达成跨 AS IPv6 路由交换。 全方位培养学生 IPv6 网络问题分析与解决能力。从教学目标来看,该案例可帮助学生掌握 IPv6 地址及相关协议的配置应用,形成网络拓扑设计、故障排查的核心能力,同时培育自主学习与综合设计的专业素养。此案例在创新特色方面,不仅结合 “101计划” 核心教材、携手华为融入国产信创技术,贴合工程实际需求,还实现了 IPv6、OSPFv3 与 BGP 协议基础及进阶技能的全覆盖。目前该案例已应用于吉林大学《IPv6 技术与实践》课程,服务 94 名计算机科学与技术、网络空间安全专业大四学生,借助仿真实验助力学生夯实技术能力,且已形成标准化实验手册。 实验室教学团队深耕计算机网络课程教学实践多年,成果实现了教学质量与示范辐射的双重突破。在课程与教材建设上,核心课程 “计算机网络” 获国家级精品课程、国家级精品资源共享课、省级课程思政示范课程等多项荣誉,系列教材被全国 100 余所高校采用、国家级精品资源共享课面向社会开放后学习人次超 2.3 万,将育人成果延伸至社会学习者,实现了优质资源的全国广泛辐射。在教学改革引领上,团队累计开展20余场全国性师资培训和经验推广,惠及千余名高校教师,有效破解课程育人共性难题;形成可复制、可推广的改革范式。在成果与团队荣誉层面,团队先后斩获 3 项国家级教学成果二等奖、2 项省级教学成果一等奖,还获评 “吉林省优秀教学团队”“吉林大学黄大年式教师团队” 等称号,充分彰显了团队在教学领域的卓越担当与突出贡献。

Read More
ICS Lab 关于物联网数据挖掘的研究成果被IoTJ接收
实验室物联网数据挖掘方向工作被IoTJ(中科院一区)接收,论文题目为“LLM4TAP: LLM-enhanced TAP Rule Recommendation”。该论文提出一种名为LLM4TAP的触发-动作编程(TAP)规则推荐方法,通过大语言模型推断用户创建TAP规则的需求和意图来实现更准确的规则推荐,是实现意图驱动的智能化TAP规则推荐系统的一项创新性探索。该论文第一作者为实验室2020级博士吴刚,通讯作者为吉林大学副教授王峰,其他合作者包括吉林大学教授胡亮和2022级硕士胡喻晓。 研究背景 TAP规则推荐旨在通过分析用户的历史行为和规则文本语义,来预测用户需求和意图,并为其提供个性化的自动化规则推荐。然而,实现有效的TAP规则推荐存在两方面局限: 难以识别与区分用户需求和意图:在TAP中,用户需求(如离开家时关闭灯光)通常隐含着用户意图(如节能或增强安全性),理解需求与意图之间的微妙关系对于生成相关且个性化的规则至关重要。 用户-规则图的高稀疏性:由于每个用户通常仅创建少量规则,导致用户-规则图高度稀疏。这种稀疏性阻碍了用户偏好的准确表示,并限制了基于图的推荐方法的有效性。 为了应对以上挑战,研究团队提出了一种基于多视图嵌入的物联网TAP规则用户意图预测方法MvTAP,通过从用户视图、开发者视图和知识视图中学习规则的嵌入向量来预测用户意图。其次,应用MPNN、TextCNN和RKE分别学习用户视图、开发者视图和知识视图的嵌入向量,并提出了一种基于Transformer的多视图嵌入融合方法,以有效整合这些嵌入向量,保存全局和局部信息。 实验设计 LLM4TAP利用LLM来编码用户创建规则背后的需求与意图,并采用图增强技术缓解用户-规则交互中的稀疏性问题。其核心由以下四个模块组成: 用户需求与意图推断模块:该模块设计了一种提示模板,将规则的文本描述及用户-规则交互作为输入传递给LLM,从而生成用户需求与意图及其对应的语义嵌入向量。 用户规则图增强模块:该模块采用奇异值分解构建用户-规则图的增强视图,以捕捉用户与规则之间的全局结构关系。随后,通过基于GNN的二分图嵌入技术学习增强图的结构,生成用户与规则的全局结构嵌入向量。 双重表示对齐模块:为提高模型性能,该模块采用对比学习技术,将用户需求与意图的语义嵌入向量以及全局结构嵌入向量与主干模型的特征嵌入向量进行对齐。 推荐和模型训练模块:该模块采用BPR损失函数对 LLM4TAP 模型参数进行优化,进而基于用户与规则的嵌入向量,预测用户创建相应规则的概率。 实验结果 实验在IFTTT和Wyze数据集上引导,与LightGCN、SGL、NCL、RLMRec等方法进行对比。实验结果表明,在Wyze数据集上,LLM4TAP在所有评价指标上均优于现有最优的对比方法。而在IFTTT数据集上,LLM4TAP在HitRate@10至HitRate@50以及NDCG@5至NDCG@50等指标上均取得了最优性能。 IoTJ全称为IEEE Internet of Things Journal,是物联网研究领域的权威性、综合性顶级期刊。它专注于发表从底层硬件、通信技术,到上层数据处理、人工智能应用的创新研究成果。该期刊由IEEE出版,在JCR和中科院分区中均具有较高评价,影响因子稳定在8.9以上,审稿周期约6个月,其核心研究领域覆盖物联网、通信、人工智能等前沿技术。

Read More
ICS Lab 关于物联网数据挖掘的研究成果被ESWA接收
实验室物联网数据挖掘方向工作被ESWA(中科院一区)接收,论文题目为“User intention prediction for trigger-action programming rule using multi-view representation learning”。该论文提出一种名为MvTAP的触发-动作编程(TAP)规则用户意图预测方法,利用多视图嵌入技术学习用户创建TAP规则背后的意图,以提升规则推荐的多样性,是实现智能家居、智慧城市等物联网智能化应用的关键技术。该论文第一作者为实验室2020级博士吴刚,通讯作者为吉林大学副教授王峰,其他合作者包括吉林大学教授胡亮、2022级硕士胡喻晓和2020级博士邢永恒。 研究背景TAP规则用户意图预测旨在推断用户创建规则背后的隐性意图,从而提高TAP规则推荐的多样性,是智能家居平台、自动化工具或规则推荐实现更高智能化和用户体验的关键组成部分。然而,预测用户创建TAP规则背后的意图存在三个问题: 触发器和动作之间的上下文依赖关系导致用户在组合不同功能时会产生多种意图。例如,规则“人离开时关灯”体现了节能的意图,而“日出时关灯”则更多体现了光照调控的意图,尽管二者具有相似的动作,但其背后隐含的用户意图却显著不同。 触发器与动作通常仅以简短的文本描述呈现,造成意图边界难以精准识别。这类描述在语义层面存在高度压缩,导致模型在解析用户需求时面临较大困难,尤其是在缺乏上下文补充信息的情况下尤为明显。因此,如何在简短的功能描述中准确识别用户意图是一个挑战。 实体之间缺乏常识知识使得实体相关性的发现受到限制,导致跨功能自动化的局限性。例如,空调和风扇虽然属于不同类型的设备,但它们具有相似的功能(如制冷)和使用场景(如卧室)。 为了应对以上挑战,研究团队提出了一种基于多视图嵌入的物联网TAP规则用户意图预测方法MvTAP,通过从用户视图、开发者视图和知识视图中学习规则的嵌入向量来预测用户意图。其次,分别应用了MPNN、TextCNN和RKE来学习用户视图、开发者视图和知识视图的嵌入向量,并提出了一种基于Transformer的多视图嵌入融合方法,以有效整合这些嵌入向量,保存全局和局部信息。 实验设计 基于多视图嵌入的物联网TAP规则用户意图预测方法包含以下五个主要模块。如上图所示: 用户视图嵌入:该模块基于用户创建的触发-动作对构建用户视图。为编码用户语义信息,采用MPNN对用户视图进行学习,生成触发器和动作的嵌入向量。 开发者视图嵌入:该模块以开发者提供的触发器和动作的描述文本为输入,利用NLP技术(即TextCNN)学习触发器和动作的句子级嵌入向量。 知识视图嵌入:该模块将与触发器和动作相关的实体映射到外部知识库(即ConceptNet),建立从实体到知识图谱概念的链接。随后,采用RKE方法,基于知识图谱聚合语义邻居的嵌入向量,学习知识增强的触发器和动作的嵌入向量。 多视图嵌入融合:该模块引入基于Transformer的融合方法,将从上述三种视图学习到的触发器和动作嵌入进行融合,并在用户视图约束下结合,生成TAP规则的嵌入向量。 用户意图预测:该模块以TAP规则的嵌入向量作为输入,预测每条规则对应的用户意图。 实验结果 实验在IFTTT数据集上进行,首先对比了MvTAP与GAT、SeHGNN、KGAN等15种对比方法在TAP用户意图预测任务上的有效性,然后展示了MvTAP在TAP规则上的表现。实验结果表明,在TAP规则用户意图预测任务方面,提出的MvTAP方法在准确性、Micro-F1和Macro-F1指标上表现优异,较现有最优方法分别提升了1.8%、4.36%和4.52%。与单视图方法相比,MvTAP的准确性分别比开发者视图、用户视图和知识视图中表现最好的方法提高了34.65%、1.8%和11.33%。与效果最好的多视图方法相比,MvTAP在准确性、Micro-F1、Macro-F1和特异性指标上的提升分别为19.28%、8.55%、5%和0.35%。此外,MvTAP在准确性、Micro-F1和Macro-F1指标上的表现也优于其变体方法。另外,在TAP规则推荐任务方面,相较于IFTTT平台,基于MvTAP预测的用户意图来推荐TAP规则实现了更高的优越性。 ESWA全称为Expert Systems With Applications,是人工智能领域的重要国际期刊,专注于人工智能理论方法研究及实践应用。该期刊由Elsevier出版,在JCR和中科院分区中均具有较高评价,影响因子稳定在7.5以上,审稿周期约13.8个月,是闭源期刊。其核心研究领域覆盖专家系统、数据挖掘、物联网等前沿技术,尤其注重方法应用创新。

Read More
ICS Lab 关于量子机器学习的研究成果被ASOC接收
实验室在量子计算方向的研究工作被Applied Soft Computing(中科院2区)接收,题目论文为“Design and Implementation of Run-length Encoding on Quantum Computers for Resource-efficient Data Representation”。这篇论文为ICASSP 2025(oral)论文:”Quantum Run-length Encoding: Optimizing Data Compression on Quantum Computers with Exponential Resource Efficiency”的更详细期刊版本。本文提出了经典游程编码的量子算法形式,实现最优条件下指数级量子自资源优化的数据存储方式,并在一般情形下也增加额外开销,解决了经典游程编码的局限性,同时探索了其在图像处理方面的应用。该论文的第一作者为实验室2022级博士张嘉乐,通讯作者为实验室负责人吉林大学副教授胡俊成,其他合作者包括吉林大学教授车喜龙、实验室本科生彭顺、2023级硕士生范滨丞、电子科技大学博士生陈庚和信息工程大学博士生马权公。 研究背景量子计算借助叠加态和量子纠缠,可以在数据处理上展现出比经典系统更高的比特效率。然而,如何将经典数据有效地编码为量子态,仍然是当前量子计算中的一大难题。现有的量子数据表示方法虽然能在某些情况下降低资源消耗,但大多数依赖于复杂的预处理过程,且无法做到无损的数据恢复。 实验设计 如上图所示, QRLE通过对数据中的连续重复部分进行编码,将每段重复数据的值和重复长度分别存储在量子位上,利用量子计算中的Hadamard门和控制非门(CNOT)对数据进行高效编码。在最优条件下,QRLE能够将量子比特消耗从O(n)降低至O(log n),并将运行时间复杂度从O(n ⋅ 2^2n)降至O(log n ⋅ n),这使得其在量子计算中具有显著的资源优势。 实验结果为了验证QRLE的有效性,研究团队在IBM的超导量子计算机(IBM_Sherbrooke)上进行了实验,并与现有的量子图像表示模型进行了对比。实验结果表明,在处理具有大量重复数据的图像时,QRLE显著减少了量子资源消耗,并且运行时间复杂度比现有方法低得多。此外,QRLE对量子噪声具有更强的抗干扰能力,能够在噪声环境下保持较高的恢复准确度。 QRLE作为一种量子数据表示的新型方法,在减少量子资源消耗、提高量子计算效率方面展现出了巨大的潜力。尤其在量子图像处理领域,QRLE能够大幅提升量子图像处理操作的效率,尤其是在量子硬件噪声较大的环境下,表现出比现有方法更强的鲁棒性。未来的研究方向可能包括结合量子神经网络,进一步优化QRLE在实际量子计算任务中的应用,推动量子计算在实际场景中的应用落地。该成果受到国家重点研发计划(2024YFB3310202)和吉林省重点研发计划(20250201076GX)的资助。 Applied Soft Computing是一本国际期刊,致力于推广软计算的综合应用以解决现实问题。Soft Computing是一系列方法论的集合,其目的在于利用对不精确性、不确定性和部分真实性的容错能力,以获得可处理性、鲁棒性及较低的求解成本。该期刊聚焦于发布在模糊逻辑、神经网络、进化计算、粗糙集及其他类似技术的应用与融合方面的最高质量研究,以应对现实世界的复杂性问题。

Read More
ICS Lab 研究成果被AAAI2026接收(Oral)
实验室在人体姿态分析方向的研究工作被人工智能领域国际顶级会议AAAI2026(CCF-A类)录用(Oral),论文题目为“Breaking the Passive Learning Trap: An Active Perception Strategy for Human Motion Prediction”。在主技术赛道第一阶段总审稿量为23,680篇,被接受量为4,167篇(总体接受率为17.6%)。该论文第一作者为实验室负责人吉林大学副教授胡俊成,通讯作者为吉林大学助理研究员吕克敌,主要合作者包括吉林大学助理教授张子健、助理研究员李莹姬、实验室21级博士生王国毓和大连民族大学王泽宇老师。 研究背景[]!(p1.png) 3D人体运动预测旨在通过高维、高随机性的历史姿态观测,精准推断未来人体运动轨迹,是人工智能对人类行为实现细粒度理解与认知的核心任务之一。然而,现有方法过度依赖时空关系与运动特征的隐式网络建模,普遍陷入 “被动学习陷阱”—— 不仅在 3D 坐标信息获取中存在冗余与单一化问题,更因缺乏主动引导的显式学习机制,严重制约预测精度。这类局限主要源于两方面: 1)数据感知局限:现有方法多直接在 3D 姿态空间进行动态建模,继承了人体运动固有的高维性与随机性等复杂特性,导致有效运动特征常处于耦合状态,且诸多隐式运动学特性难以在刚性 3D 表征中实现有效编码,网络被迫学习冗余的坐标系信息; 2)网络感知局限:当前方法多依赖静态架构进行被动信息聚合,缺乏显式、主动引导的学习机制,难以动态适配复杂的时空依赖关系,最终削弱了对复杂运动模式的建模能力,进而导致模型泛化能力不足,难以应对多样化运动模式。 为突破上述难题,研究团队提出面向人体运动预测的主动感知策略:一方面借助商空间表征对运动特性进行显式编码,另一方面引入辅助学习目标强化时空建模,通过这双重创新实现运动信息的主动解耦与时空依赖的动态学习,成功将传统“黑箱端到端拟合”范式升级为主动学习范式,有效规避被动学习陷阱的负面影响。 实验设计 为突破 3D 人体运动预测(HMP)领域的被动学习陷阱,论文提出主动感知策略(APS) ,该策略为模型无关框架,可集成于不同预测模型以增强主动感知能力,核心通过两大模块协同实现运动信息的高效处理与时空依赖的主动学习,同时设计复合损失函数保障训练效果。 核心框架设计APS 整体遵循 “数据预处理 - 主动学习 - 预测输出” 逻辑,先通过数据感知模块(DPM)优化输入数据质量,再由网络感知模块(NPM)强化模型学习能力,最终输出精准的未来运动轨迹预测结果,两大模块功能互补,共同解决传统方法的数据与网络感知局限。 DPM 旨在解决数据感知局限,通过商空间表征将高维 3D 姿态序列映射至低维空间:先借助切空间算子计算关节相邻帧间的速度向量并构建速度矩阵,将其转化为切向量以捕捉局部运动动态;再通过格拉斯曼流形算子将切向量投影至三个固定的 2 维子空间,计算切向量与投影的正交余弦以量化分布特征,最终形成包含姿态、切向量及正交余弦的商空间表征,实现运动几何与坐标冗余的解耦,同时完成几何降维、语义解耦与动态约束。 NPM 则用于突破网络感知局限,通过主动学习机制强化时空依赖建模:其时空增强组件(SEC)通过随机掩码关节坐标或注入高斯噪声生成扰动数据,设计坐标重构与噪声去除的辅助学习任务,迫使网络理解内在运动模式;时空学习组件(SLC)采用生成对抗 Transformer 架构,通过分离式的空间注意力与时间注意力机制,分别捕捉关节间的空间关联与关节运动的时间动态,动态整合局部关系与全局语义;同时搭配基于 WGAN-GP 的运动判别器,通过保真度判别器与连续性判别器分别保障预测姿态的真实性与时间连贯性,进一步提升模型对复杂运动模式的适配能力。 实验结果 方法在 H3.6M 等数据集上以平均关节位置误差(MPJPE)为核心指标,将 APS 与 AMHGCN、HMR、FDU、GA-MIN、SAGGB 等现有 SOTA 方法展开对比,实验基于 PyTorch 框架与 NVIDIA 3090Ti GPU,训练参数设置为15 个epoch、批次大小16,评估了80ms、160ms、320ms、400ms、560ms、1000ms等不同时效的预测性能。结果显示,APS 在短时效(80-400ms)和长时效(400-1000ms)预测中均显著优于对比方法:短时效预测平均较基线方法提升 7.3%-46.2%,对 SAGGB 的优势达 12.8%-39.5%,复杂动作场景下误差降低 29.8%-73.8%;长时效预测平均误差降低 17.1%-59.8%,1000ms 时平均误差降至 92.4mm,其中 “Directions” 动作误差仅 59.8mm(SAGGB 为 101.8mm),“Walking Dog” 动作误差 109.2mm(SAGGB 为 137.3mm),且在非周期性与周期性动作中均保持稳定优势,验证了其在建模长时时空依赖与复杂运动模式上的有效性。 AAAI 2026是人工智能领域的顶级学术会议,全称为Association for the Advancement of Artificial Intelligence。该会议将于2026年1月20日至27日在新加坡举行。AAAI是人工智能领域最具影响力的国际会议之一,与IJCAI和NeurIPS并列,是发表人工智能领域前沿研究的重要平台,也是中国计算机学会(CCF)推荐的A类国际学术会议。会议涵盖多个重要方向,包括机器人技术、知识表示与推理、多智能体系统等。

Read More
ICS Lab 研究成果被JSTSP接收
实验室在计算成像方向的研究工作被被信号处理领域顶级刊物JSTSP录用,论文题目为“Efficient Video Representation via Hybrid Key Frame Reconstruction: A Test-time Data Augmentation Approach”。该论文第一作者为实验室负责人吉林大学副教授胡俊成,通讯作者为吉林大学助理研究员吕克敌,主要合作者包括清华大学电子系教授陈宏伟、北京清智元视科技有限公司黄泓皓博士和实验室22级卓班本科生冯玉琪。 研究背景动态编码时域压缩成像中的视频重建,是计算成像与计算机视觉交叉领域的核心任务,广泛应用于安防监控、自动驾驶等安全关键场景。其核心目标是通过压缩测量数据精准还原高质量视频,同时保障结果的可信度与可靠性。然而,现有方法存在两大关键瓶颈:1)数据获取局限:传统单模态采样架构难以平衡时间分辨率与空间细节,长曝光压缩帧易丢失静态特征,短曝光帧则难以捕捉运动信息,导致重建视频存在细节模糊或运动失真问题;2)不确定性缺失:深度学习模型的确定性输出缺乏置信度量化机制,在复杂纹理区域(如边缘过渡、文本元素)易产生未知误差,给高风险场景应用带来安全隐患。为破解上述难题,团队提出融合测试时数据增强的混合关键帧辅助压缩视频重建方案,通过采样架构创新与网络设计优化,实现视频重建质量与不确定性量化的双重提升。 实验设计 论文提出的 KH-TTA(Key Frames Assisted Hybrid Compressive Video Reconstruction with Test-time Data Augmentation)框架,是一套模型无关的高效视频重建解决方案,核心通过三大创新模块协同突破传统方法局限:1)双模态采样架构:同步捕捉长曝光压缩帧与短曝光关键帧,前者提供完整运动信息,后者保留高精度空间细节,通过互补数据输入解决单模态采样的固有 trade-off;2)时空变换测试时增强:设计符合成像物理约束的时空变换策略(包括空间翻转、90°整数倍旋转等),通过蒙特卡洛近似对后验分布采样,实现重建结果的统计融合与不确定性量化,无需修改原有模型结构;3)深度展开重建网络:基于8阶段迭代优化框架,集成特征共享去噪先验与时空对齐机制,增强模型对不同编码方案的适应性,提升跨场景泛化能力。同时,框架通过亮度线性缩放与双阶段融合策略,进一步优化关键帧与压缩帧的信息协同,有效抑制重建伪影。 实验结果 团队在模拟数据集与真实硬件系统中,将 KH-TTA 与 GAP-TV、RevSCI、ELP 等当前主流 SOTA 方法展开全面对比,实验基于 PyTorch 框架与高性能计算硬件,以 PSNR(峰值信噪比)、SSIM(结构相似性)、LPIPS(感知相似度)为核心评估指标,覆盖道路标识、车辆、生物等多类场景。结果显示,KH-TTA 在各项指标上均实现显著突破:平均 PSNR 较现有最优方法提升0.45-1.01 dB,SSIM提升0.0074,LPIPS降低12.9%,在复杂纹理区域的重建细节更清晰、伪影更少。同时,其不确定性量化机制表现出极高可靠性,重建误差与标准差的相关系数达0.85,硬件实验验证 R² 值为0.7194,可精准映射视觉误差分布。在长时效重建任务中,该方法仍能保持稳定性能,为动态场景下的高质量视频还原提供了有效解决方案。 JSTSP全称为IEEE Journal on Selected Topics in Signal Processing,是IEEE信号处理学会(IEEE Signal Processing Society)旗下的旗舰期刊,专注于发表信号处理领域的前沿研究。其最新影响因子为13.7,在信号处理领域长期保持顶尖学术影响力。

Read More
ICS Lab 师生参加第22届中国计算机大会(CNCC2025)进行学术交流
2025年10月23日,第22届中国计算机大会(CNCC2025)在哈尔滨开幕。本届大会注册人数突破1.2万人,汇聚了来自全球计算机领域的顶尖学者、产业领袖、青年学子及国际组织代表,盛况空前。大会以“数智赋能、无限可能”为主题,旨在深度探讨数字智能技术的前沿进展与未来趋势,积极响应国家“人工智能+”行动计划,为推动计算技术与经济社会深度融合贡献智慧。 开幕式上,CCF理事长、中国工程院院士孙凝晖,黑龙江省人民政府副省长张起翔,哈尔滨市副市长杨淑鹏,哈尔滨工业大学校长、中国科学院院士韩杰才,哈尔滨工程大学党委书记宋迎东等主办方、地方政府及承办单位领导出席开幕式并致辞。CCF理事长孙凝晖在开幕致辞中,首先代表学会向全体与会嘉宾表示热烈欢迎。他指出,CNCC作为CCF的旗舰会议,始终致力于搭建高水平学术交流平台。本届大会选址哈尔滨,得到了黑龙江省、哈尔滨市政府及哈尔滨工程大学、哈尔滨工业大学等承办单位的大力支持。他特别提到,大会主题“数智赋能、无限可能”是对国家人工智能发展战略的积极响应,大会精心策划了包括主旨报告、专题论坛、技术研讨以及首次打造的超万平方米计算机展览会在内的丰富活动,并新增了支持青年学者成长的“专题研习班(Tutorial)”环节,力求让每一位参会者都能有所收获。他鼓励与会者在承载着“哈军工”红色基因与科技创新精神的哈尔滨,深入交流,激荡思想,收获友谊与新知。 实验室成员参会在本次中国计算机大会(CNCC)上,我实验室师生集体参会。由实验室负责人胡俊成老师带队,成员包括实验室全体博士生及研一、研二硕士生(部分合影),共同参与了大会的各项学术活动。此次参会不仅加强了实验室与国内外顶尖学者及行业专家的深度交流,拓展了团队的国际化学术视野,更充分展现了实验室在创新型人才培养、前沿科研攻关以及学科交叉融合方面的特色与成果,进一步提升了实验室在相关领域的学术影响力与知名度。 实验室部分参会成员合照 论坛深入在本次CNCC会议上,实验室师生积极参与了多个前沿技术论坛,收获颇丰。在系统方向,我们深入参与了”大模型时代机密计算如何筑牢安全防线?”、”面向超大规模智算集群的新型存算技术”以及”从数据库到大模型”等专题论坛;在量子与AI方向,重点参加了”国盾超导量子计算专项合作计划开题交流会”、”基座模型驱动下的智能体边界与应用落地”和”数据库与AI技术创新”等论坛。通过参与这些高水平学术论坛,实验室团队不仅与领域顶尖专家建立了深入交流,更精准把握了各研究方向的最新进展和未来趋势。通过与产业界和学术界的直接对话,我们进一步明确了实验室现有研究工作的创新点和突破方向。这些宝贵的交流经验,将为实验室后续的科研攻关、技术转化和人才培养提供重要参考,同时也为建立更广泛的产学研合作奠定了坚实基础。此次参会也显著提升了实验室在相关领域的学术影响力,展现了我们团队在前沿技术探索中的活力和潜力。 我实验室论坛在本次CNCC会议上,我实验室胡俊成老师作为共同主席,与CCF杰出会员、浙江大学长聘教授、之江实验室副主任何水兵教授共同组织了”面向超大规模智算集群的新型存算技术”专题论坛。该论坛聚焦于面向超大规模智算集群的新型存算技术,围绕计算、存储和可靠性等关键要素展开深入讨论,探索大规模计算框架、新型存储架构以及高效容错技术等多个领域的最新进展与未来趋势。论坛汇聚了该领域顶尖学者和企业技术专家,围绕大规模计算框架优化、新型存储架构设计以及高效容错技术等前沿方向,分享了最新研究成果和技术突破。作为论坛组织方,我们不仅促进了学术界与产业界的深度对话,更为超大规模智算系统的技术创新提供了重要交流平台。此次论坛的成功举办,既彰显了我实验室在该领域的研究实力,也为相关技术的产学研合作创造了新的契机。 与会专家合影

Read More
ICS Lab 师生参加第二届CCF中国存储大会和IJCAI25广州分会场进行学术交流
第二届 CCF ChinaStorage 2025 大会于2025年8月28日-30日在湖北省武汉市召开。大会指导委员会由陈左宁教授、何友教授、王恩东研究员、孙凝晖研究员、郑纬民教授、蒋昌俊教授、钱德沛教授、金海教授、肖侬教授等顶级专家组成,复旦大学刘明研究员与华中科技大学冯丹教授共同担任大会主席。 大会以“智存·智算·智能”为主题,围绕智能存储与计算技术前沿发展方向,针对新型存储器件与体系结构、网存算融合、大模型存算、内存池化、存储芯粒、数据缩减、存储编码与安全、EB级存储等问题展开研讨,并组织中小企业产学对接会、业界新兴产品展览、顶会论文和学术海报分享等活动,面向前沿技术进展、市场趋势和创新应用展开广泛交流和思想碰撞,为领域内的专家学者、学生、从业者提供一场学术产业交流盛会。 JLU智能计算与系统实验室负责人胡俊成老师带领21级博士生王国毓、25级博士生裴辰举、25级博士生张程和24级硕士生周璨参加本次存储大会。 在“新介质与新场景下的存储顶会论坛”(论坛主席为中国科学技术大学袁龙教授、武汉理工大学杜亚娟副教授)上,实验室博士生王国毓汇报了其发表于存储领域顶级学术会议FAST’25的研究成果:“Boosting File Systems Elegantly: A Transparent NVM Write-ahead Log for Disk File Systems”。该研究提出了NVLog,旨在利用NVM透明加速传统磁盘文件系统。 此外,在大会的学术海报展示环节,实验室荣获“最佳论文海报奖”。该奖项旨在表彰在展示内容上具有创新性和学术价值的海报作品。该海报系统性地可视化了发表在FAST’25上的研究成果,其设计的简洁理念与实用性吸引了与会专家的关注与交流。 2025年CCF中国存储大会最佳论文海报奖获奖情况 实验室博士生王国毓上台领奖 会议之后,由华中科技大学周游老师和大普微电子吕涛博士共同组织、大普微电子赞助的足球友谊赛成功举办。这项活动为与会学者和产业界人士提供了一个在紧张学术交流之余,以球会友、增进了解、促进合作的轻松平台。 另外,IJCAI25(The 34th International Joint Conference on Artificial Intelligence)作为人工智能领域最具影响力的顶级国际会议之一(中国计算机学会CCF推荐A类),与AAAI、NeurIPS并列,是发表全球人工智能前沿研究的重要平台,其内容涵盖人工智能理论与架构、机器学习、自然语言处理、计算机视觉、机器人科学等几乎所有核心领域。为促进更广泛的学术交流,本次IJCAI大会在广州设立了分会场。 实验室2023级博士生马琳参加了IJCAI25广州分会场的活动,并在会上作了题目为“MCF-Spouse: A Multi-Label Causal Feature Selection Method with Optimal Spouses Discovery”的报告。该报告展示了实验室在多标签因果特征选择方向取得的最新研究进展。借助IJCAI这一顶级国际平台,实验室团队与来自全球的人工智能学者进行了深入交流和研讨,积极汲取前沿知识,探讨潜在合作机会,为进一步提升实验室在该领域的研究水平拓宽了思路。 实验室博士生马琳在IJCAI25广州分会场上进行成果汇报分享 实验室博士生马琳与其论文海报合影 实验室博士生马琳与其他参会者合影 通过深度参与本次CCF中国存储大会与IJCAI25会议,实验室团队在存储系统与人工智能双领域实现了成果展示与前沿洞察的双向收获。团队成员不仅通过大会报告、海报展示、学术研讨等多种形式,向国内外同行分享了最新的研究进展,也广泛汲取了智能存储、大模型存算、机器学习、特征选择等方向的前沿动态与产业趋势。这些宝贵的交流成果,为实验室凝练研究方向、拓展合作网络、提升科研水平注入了新的动能,也进一步彰显了团队在相关领域的活跃度与贡献力。

Read More
ICS Lab 一项研究成果被FGCS接收
实验室量子计算方向工作被FGCS(中科院二区)接收,论文题目为“Denoising Diffusion Models with Optimized Quantum Implicit Neural Networks for Image Generation”。该论文提出了一种名为Optimized Quantum Implicit Denoising Diffusion Model (OQIDDM)的创新性框架,结合优化的量子隐式神经网络(OQINNs)与一致性模型(Consistency Models),显著提升了量子图像生成的质量与效率,为量子生成任务开辟了新路径。该论文第一作者为实验室2022级博士张嘉乐,通讯作者为实验室负责人胡俊成老师,主要合作者包括吉林大学车喜龙教授、实验室2024级硕士樊宇哲、吉林大学软件学院本科生彭顺、电子科技大学博士生陈庚和信息工程大学博士生马权公。 研究背景图像生成是计算机视觉领域的核心研究方向,广泛应用于数据合成、艺术创作等领域。传统去噪扩散模型(DDMs)在生成高质量图像方面表现出色,但量子扩散模型常依赖复杂的混合U-net架构或混合态操作,需频繁的量子-经典数据转换,导致训练效率低、噪声中间尺度量子(NISQ)设备兼容性差。如何在减少参数量、提升图像质量的同时,适配NISQ设备,成为亟待解决的挑战。OQIDDM通过优化量子隐式神经网络结构,结合一致性模型的单步采样优势,为高效量子图像生成提供了全新解决方案。 实验设计 如图1所示,OQIDDM通过经典正向扩散过程和量子逆向去噪过程实现高效图像生成。其核心设计包括: 正向扩散:采用经典高斯噪声逐步扰动输入数据,生成完全高斯分布的噪声样本,节省量子资源。 逆向去噪:利用OQINNs拟合一致性模型的映射函数,通过单步去噪直接从噪声样本生成干净图像,降低多步迭代需求。 OQINNs架构:优化传统量子隐式神经网络(QINNs),仅使用两个经典线性层进行维度处理,核心网络为全量子模块,减少量子-经典数据交换,提升NISQ设备兼容性。 OQINNs通过N层数据重上传模块(data re-uploading)实现高效特征提取,每层包含旋转门(Rz)和强纠缠层(CNOT),理论证明其可作为任意平方可积函数的通用逼近器。OQIDDM的训练复杂度显著降低,采样过程仅需O(1)步,优于传统量子扩散模型的O(T)步。 实验结果实验在MNIST、Fashion-MNIST、E-MNIST以及复杂人脸数据集CelebA上进行,并在IBM量子平台的模拟器(qasm)及三台超导量子计算机(ibm_sherbrooke、ibm_kyiv、ibm_brisbane)上验证。关键结果包括: 图像质量:在MNIST数据集上,OQIDDM的PSNR值达10.44-14.18,优于Qdense(7.14-7.99)和QNN(10.32-13.03),接近经典U-net(8.06-14.34),且参数量仅为576。 复杂数据集:在CelebA 64×64人脸生成任务中,OQIDDM首次实现量子去噪扩散模型在复杂数据集上的应用,成功捕捉人脸结构,优于Qdense等模型。 噪声鲁棒性:OQIDDM对退极化噪声和旋转角度误差表现出更强鲁棒性,SSIM和PSNR值在噪声强度0.05-0.1下下降较慢。 硬件表现:在ibm_sherbrooke上,OQIDDM生成图像的量子态分布更接近模拟结果,优于ibm_kyiv和ibm_brisbane,展现出更高的NISQ设备适应性。 OQIDDM通过优化量子隐式神经网络与一致性模型的结合,不仅显著降低了量子参数量和采样复杂度,还提升了图像生成质量与噪声鲁棒性。实验验证了其在标准及复杂数据集上的优越性,以及在NISQ设备上的适用性。未来,实验室将探索OQIDDM在人体姿态预测等下游任务中的应用潜力。 FGCS全称为Future Generation Computer Systems,是计算机科学领域的重要国际期刊,专注于未来计算机系统与技术的理论方法研究及实践应用。该期刊由Elsevier出版,在JCR和中科院分区中均具有较高评价,影响因子稳定在6.2以上,自引率低至4.8%,审稿周期约2个月,是混合开放获取期刊。其核心研究领域覆盖分布式计算、云计算、物联网等前沿技术,尤其注重系统架构与理论创新。

Read More