登录会员系统  |  联系我们  |  加入学会  
学会活动
第六届CSIG图像图形技术挑战赛冠军团队介绍
发布时间:2025-11-19      来源:中国图象图形学学会      分享:

CSIG图像图形技术挑战赛是由中国图象图形学学会主办的系列赛事,迄今已成功举办六届。学会作为挑战赛的主办方,积极发挥专家优势和组织优势,搭建学术界与产业界之间的沟通桥梁,帮助解决企业技术难题,挖掘优秀人才,促进我国图像图形技术及相关产业的发展和应用。第六届挑战赛共设七个赛道,吸引了来自国内外高校、科研机构及企业共2879支队伍报名参赛。

获得本届CSIG图像图形技术挑战赛总决赛冠军的团队是“语义三维重建竞赛”赛道冠军华中科技大学杨欣教授团队。团队面向国家战略需求和未来人工智能发展趋势,围绕三维视觉及其在无人机、手术机器人等领域应用开展基础研究、技术攻关和成果转化。

赛道介绍

该赛道要求参赛队伍以不定数量的 RGB 图像序列作为输入,结合提供的相机参数,输出相应场景的三维点云重建结果以及点云语义分割结果。评测指标包括 Acc、Comp、Overall 均需达到 50 以上,mAcc 与 mIoU 不低于 50,同时要求室内场景重建精度高、语义识别稳定、延迟控制在 1 秒以内。室外场景作为附加项,将进一步检验算法在复杂动态环境中的鲁棒性与一致性。参赛方法需同时兼顾几何质量与语义一致性,确保输出的三维场景既具备精确的空间结构,又能提供可靠的语义理解。由于输入图像序列的数量不固定,视角分布多样,且可能存在光照变化、遮挡、纹理弱化、动态物体干扰等情况,任务难度较大。

1763523619816095.png 

过程思路


参赛方案介绍

针对本届语义三维重建竞赛,该团队重点实现了几何一致性的突破,提出基于单目先验的高精三维重建方法,有效融合立体匹配和单目深度的优势。核心方法如下:

  •  双支路架构:由单目深度支路与立体匹配支路组成

  • 尺度与偏移优化:在融合前先对单目深度进行全局尺度与偏移对齐,再进行模块细化,使结果在复杂曲面和空间结构变化中保持稳定。

  • 强化机制与自适应选择:

单目深度和立体视差会被交替使用,不断提升效果。具体的,模型在每次迭代中基于置信度选择可靠的立体特征,用于更新单目深度,有效减少单目尺度、偏移模糊问题;同时,更新后的单目深度进一步提升立体匹配结果,有效提高弱纹理区域的性能。

1763523650429109.png

成果展示 

在复赛阶段,团队进一步针对真实应用场景中的实时性与部署需求,对整体模型进行了系统性的蒸馏与轻量化优化设计。通过多轮教师–学生网络训练,小模型不仅充分继承了大模型在深度分布建模以及结构细节表达方面的核心能力,还在网络结构、参数量与计算量方面实现了显著压缩。团队同时引入多尺度特征蒸馏策略,使学生模型在计算资源受限的环境中仍能保持稳定、可靠的重建性能。最终,小模型在推理速度上取得大幅提升,更接近实际工程部署的要求。

1763523666650088.png

成果展示 


参赛总结与展望

在人工智能与三维感知技术深度融合的时代背景下,语义三维重建作为连接物理世界与数字世界的核心桥梁,正成为具身智能交互、元宇宙构建、智慧城市管理、工业自动化检测等前沿领域的关键使能技术。本次语义三维重建竞赛,继续聚焦前沿方向与真实需求,体现了学术探索与产业实践的紧密结合,具有重要的研究价值和应用价值。赛题难点包括光照变化、遮挡、纹理弱化、动态物体干扰复杂场景,贴合当前业界实际应用场景。比赛过程中,该团队针对以上难点提出了基于单目先验与立体匹配协同优化的创新方法。在复赛阶段,进一步对整体模型进行蒸馏与轻量化设计,大幅提升推理效率的同时保持核心性能优势,最终取得冠军成绩。



Copyright © 2025 中国图象图形学学会 京公网安备 11010802035643号   京ICP备12009057号-1

地址:北京市海淀区中关村东路95号 邮编:100190

技术支持:中科服