5月11日下午,“CSIG图像图形中国行”活动在中南大学潇湘校区信息楼535报告厅顺利举办。本次活动由中国图象图形学学会主办、CSIG智能图形专委会和中南大学承办。活动主题为“三维世界的生成、感知和计算”,特邀北京航空航天大学刘偲教授、浙江大学许威威教授、中科院计算所王树徽研究员、中科院计算所高林研究员四位领域专家,围绕大模型时代的无人机视觉语言导航、端到端三维重建、扁平学习-去中心化的神经拟态计算框架、混合表达与神经渲染进展等前沿方向作专题报告。本次活动由中南大学计算机学院夏佳志教授担任执行主席。本次活动吸引了多位师生前来参加,观众踊跃提问,与嘉宾展开了深入交流。
高林研究员介绍专委会情况
活动伊始,计算机学院夏佳志教授致欢迎辞,对莅临现场的专家学者以及广大师生表示诚挚欢迎。随后,CSIG智能图形专委会秘书长高林研究员对从基本情况、自身建设、学术交流、人才举荐等方面对专委会进行了简要介绍,之后进入专家报告环节。
刘偲教授分享报告
北京航空航天大学刘偲教授作题为《开放空间具身智能体视觉语言导航》的学术报告。报告分析大模型时代下无人机视觉语言导航面临的核心挑战与技术机遇,指出大语言模型虽为具身智能决策的可解释性与可控性带来突破性进展,但其高昂的算力消耗与冗长的推理时延仍严重制约实际场景部署。针对这一关键问题,刘偲教授系统展示了团队在三个方向的成果:构建了无人机视觉语言导航仿真平台,突破真实环境验证壁垒;提出基于大小模型协同优化的无人车/无人机视觉语言导航系统,通过异步大模型增强闭环决策框架实现模型推理流程解耦;提出基于对话增强的无人机导航范式,在自动驾驶与无人机导航场景中验证了导航性能。报告最后,刘偲教授从多模态交互机制、多智能体协同规划及虚实融合的半实物仿真场景等维度,对具身智能导航技术的的发展进行了展望。
许威威教授分享报告
浙江大学计算机科学与技术学院许威威教授作题为《端到端的三维内容构建技术研究》的学术报告。报告首先介绍了神经隐式场与3D高斯泼溅(3DGS)等几何表示的核心原理。然后展示了其在大规模场景重建、复杂光线下的新视角生成、实时人体表现捕捉和面向体积视频与全息会议的人体重建等领域的进展。重点介绍了其对高斯面元的设计与其在稀疏视角下动态人体重建中的应用。许威威教授还立足技术发展趋势,对端到端三维重建技术在沉浸式交互、数字孪生等领域的应用前景进行了前瞻性展望。
王树徽研究员分享报告
中国科学院计算技术研究所王树徽研究员发表报告《扁平学习—中心化的神经拟态计算框架》。报告介绍了其科研团队针对扁平学习加深度学习的新架构和计算范式上开展的研究。报告从神经元连接建模角度出发,阐述了如何从哈密顿动力学视角将神经元系统解耦,并将其作用关系用路径积分进行建模,提出了扁平学习的神经计算系统规模化构建思想,由此出发提出了深度学习到扁平学习的异构模型转换方法,并在语言、视觉、图等数据模态上尝试实现了扁平化模型的训练,进一步将该思想应用到基础模型的参数微调任务中,在常识推理、图像分类/检测/识别、图/节点分类等任务上进行了方法验证。最后结合已取得的进展,对该理论框架的未来发展方向进行探讨。
高林研究员分享报告
中国科学院计算技术研究所高林研究员发表报告《混合表达与神经渲染进展》。报告从几何表示切入,系统梳理了几何表征的发展脉络,多维对比分析神经辐射场(NeRF)与高斯泼溅(Gaussian Splatting)的技术特性,揭示了各自的技术优势。随后,高林研究员介绍了其团队基于高斯泼溅技术的研究进展,包括三维模型编辑技术及实际应用。三维模型编辑技术包括高斯泼溅几何、纹理和光照解耦的编辑方法、可重光照的三维高斯人头生成方法以及基于线稿的三维场景视频编辑技术。报告最后前瞻性地探讨了模型编辑技术在数字内容生成领域的应用潜力。
在互动问答环节,与会学生踊跃提问,围绕三维视觉技术的应用瓶颈、未来发展方向等议题与专家展开深入探讨。四位讲者结合各自研究领域,对提问进行了细致解答,并针对青年学者的科研路径给出了针对性建议。
最后,夏佳志教授简要总结,对专家和观众表示感谢。本次活动有效促进了三维视觉和具身智能等领域的学术交流,激发了学生的研究兴趣。
Copyright © 2025 中国图象图形学学会 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190