登录会员系统  |  联系我们  |  加入学会  
学会活动
【竞赛】第六届CSIG图像图形技术挑战赛季军团队介绍
发布时间:2025-11-18      来源:中国图象图形学学会      分享:

CSIG图像图形技术挑战赛是由中国图象图形学学会主办的系列赛事,迄今已成功举办六届。学会作为挑战赛的主办方,积极发挥专家优势和组织优势,搭建学术界与产业界之间的沟通桥梁,帮助解决企业技术难题,挖掘优秀人才,促进我国图像图形技术及相关产业的发展和应用。第六届挑战赛共设七个赛道,吸引了来自国内外高校、科研机构及企业共2879支队伍报名参赛。

获得第六届CSIG图像图形技术挑战赛总决赛季军的团队是2025“Camera学术之星”影像算法技术竞赛赛道冠军南京理工大学计算机科学与工程学院NJUST_VPEG_SR团队

本团队由南京理工大学潘金山教师指导,主要从事图像视频复原与增强等相关底层视觉问题的研究,隶属于南京理工大学智能媒体分析实验室(IMAG)。本课题组承担了国家自然科学基金重点项目、联合基金重点项目、优秀青年基金等重大科研任务,在历史影像及经典影视修复方面的成果受到新华社、央视综合频道CCTV-1、央视网、央视频等多家媒体报道。 


赛道介绍

该赛道赛题要求以低分辨长焦图像作为输入,可结合图像增强、AIGC等技术手段,实现长焦望远场景的图像细节增强,核心目标是让手机在30X、50X、100X等百倍变焦场景下也能拍摄出清晰图像,达到超越人眼、对标单反的成像效果。百倍变焦下的低分辨图像普遍存在严重的细节丢失、噪声干扰及纹理模糊问题,手机有限的传感器尺寸与光学性能,与单反设备的成像条件存在显著差距,进一步加剧了成像退化。真实拍摄场景中不可控的大气扰动、抖动模糊等因素,使图像退化模式更趋复杂多样,任务极具挑战性。

1763433320988152.png

 

参赛方案介绍

针对本届长焦图像复原任务,本团队基于长期在真实退化建模、超分辨率与扩散模型等方向的研究积累,对长焦成像特点进行了系统分析,提出了一套更契合真实拍摄场景的长焦复原方案。

现有方法普遍沿用RealESRGAN退化模型,难以有效描述长焦远距离拍摄中普遍存在的高变焦倍率、抖动模糊与涂抹感等复杂退化。本团队首先构建了更加符合长焦成像物理特性的退化建模策略,从源头提升模型对长焦场景的真实退化的解决能力。

1763433375970544.png 

在分数蒸馏方面,传统 CSD Loss 通过增强语义间接提升图像质量,但语义增强的梯度方向与真实图像增强的梯度并非完全一致,容易导致语义过度约束或细节偏移。为解决这一问题,我们提出了更契合长焦复原特性的梯度构造方式:直接利用扩散模型在小时间步长(高保真、高质量)与大时间步长(低保真、质量较差) 下的去噪结果差值作为梯度。该间隔天然携带“从粗糙到精细”的真实图像增强梯度,避免了语义蒸馏的不稳定性,使模型更容易学习到提升结构、纹理与清晰度所需的真实方向。

1763433394271035.png 

改进后的训练策略不仅强化了模型的保真能力,也显著提升了整体复原质量。在复赛阶段,我们的方案凭借更加合理的梯度构建方式,在核心指标上领先,最终获得了2025“Camera学术之星”影像算法技术竞赛赛道冠军。

1763433409990941.png

 

参赛总结与展望

在手机影像“突破光学极限”的产业潮流下,高倍率细节恢复、真实退化理解将成为提升移动影像体验的核心竞争力。本次2025“Camera学术之星”影像算法技术竞赛,从命题设计、平台支持到赛事评审,学会与华为终端通力协作、全力保障,具有较高的学术价值与实践意义,也带来了面向未来图像增强趋势的新思考。

NJUST_VPEG_SR 团队在极具挑战性的长焦成像复原任务中,以扎实的技术积累和严谨的实验分析为基础,从真实手机长焦拍摄机制出发,构建了更契合真实长焦退化的建模方式,并提出了基于不同时间步去噪间隔构建的全新梯度信号,使模型能够准确掌握“从模糊到清晰”的增强路径。经过多轮迭代优化,该方案在细节重建、边缘结构保持与长焦语义一致性方面表现突出,最终获得本届大赛总决赛季军。



Copyright © 2025 中国图象图形学学会 京公网安备 11010802035643号   京ICP备12009057号-1

地址:北京市海淀区中关村东路95号 邮编:100190

技术支持:中科服