8月2日-4日,第五届全国SLAM技术论坛在西北工业大学长安校区成功举办。本届论坛由中国图象图形学学会(CSIG)主办,西北工业大学、CSIG三维视觉专委会、陕西省信息获取与处理重点实验室联合承办,深蓝学院协办。来自SLAM及相关领域学术界、企业界的600余位同仁齐聚一堂,大会聚焦SLAM和相关技术的前沿发展以及在应用领域的行业机会,以“大模型与SLAM2.0”为主题,旨在为SLAM技术和应用领域搭建全方位展示与交流平台,推动国内SLAM技术的发展以及产学研融合。大会主席由西北工业大学戴玉超教授、厦门大学王程教授和浙江大学章国锋教授共同担任。
8月3日上午举行了开幕式。中国图象图形学学会副理事长兼秘书长马惠敏教授线上致辞介绍了学会的相关工作和主办该论坛的背景与意义,并对本次论坛报告嘉宾即将为大家带来领域内前沿观点和技术表示感谢。陕西省信息获取与处理重点实验室负责人、APSIPA副会长、中国图象图形学学会会士何明一教授代表承办单位致辞,以悠然见南山、云横秦岭的优美环境和扎根西北、为国铸剑的西工大人的家国情怀热情地欢迎与会嘉宾和代表,高度概况了大模型为代表的人工智能最新技术的特点以及对本次“大模型与SLAM2.0”为主题的论坛的重要意义。大会主席章国锋教授致辞并介绍了全国SLAM技术论坛的主旨与初衷,以及论坛历届情况。开幕式由大会主席、西北工业大学戴玉超教授主持。
会议邀请了北京大学查红彬教授、澳大利亚国立大学(ANU)教授李宏东教授、中国科学院大学人工智能学院吴毅红教授、山东大学秦学英教授和上海交通大学卢策吾教授作主旨报告,邀请了浙江大学高飞副教授、香港城市大学殷鹏助理教授、湖南大学周易教授、清华大学弋力助理教授、商汤科技刘浩敏研究总监、和上海AI实验室李弘扬青年科学家作6场特邀报告,此外还组织了2场圆桌论坛,优秀论文分享9篇,合作单位技术宣讲4家等丰富的学术活动。专家们分享交流人工智能大模型、SLAM、机器视觉等领域的国际前沿技术、研究现状、未来机遇、成果与应用等。
图 1 马惠敏教授线上致辞
图 2 何明一教授致辞
图 3 章国锋教授致辞
图 4 戴玉超教授主持开幕式
开幕式上,组委会为合作企业举办了隆重的颁奖仪式,以感谢企业的大力支持。他们分别是铂金合作单位莫界科技,金牌合作单位滴滴自动驾驶,竞赛合作单位北京数字绿土科技股份有限公司以及商汤,银牌合作单位北京度量科技有限公司。
图 5 中国图象图形学学会会士、西北工业大学何明一教授为铂金合作单位颁奖
图 6 大会主席章国锋教授为金牌合作单位颁奖
图 7 大会主席王程教授为竞赛合作单位颁奖
图 8 程序委员会主席温程璐教授为银牌合作单位颁奖
本次论坛邀请了查红彬、李宏东、吴毅红、卢策吾、秦学英5位知名专家,为大家带来5场主旨报告。
查红彬教授在会议上作了题为《具身视觉与SLAM:在线学习的途径》的报告,探讨了SLAM(Simultaneous Localization and Mapping,即同时定位与地图构建)技术的发展,从最初的智能体在静态环境中建模运动和构建地图,到逐步实现具身化理解环境并主动适应场景变化的需求。查教授提出了一种基于在线学习的具身SLAM系统,将传感器数据转化为动态数据流,并从偏微分方程的角度分析环境的动态变化。通过将具身SLAM问题转化为数据预测问题,并采用在线学习方法来预测智能体主动运动所引发的环境变化。突破性地实现了具身智能体在现实场景中的环境变化预知,并加强了智能体行为与环境间的紧耦合。此外,针对环境中可能存在的动态物体干扰,还设计了一种动态扰动判别器,其能够在具身智能体探索环境的过程中,指导在线学习系统专注于静态物体的语义理解,从而在存在动态干扰的环境下实现高精度的场景建模。
图 9 查红彬教授作报告
李宏东教授线上作了《From Multi-View 3D Reconstruction to Single-View 3D Generation》的报告,围绕最近在三维视觉领域所取得的最新研究成果与前沿探索进行了汇报。首先,介绍了最新开发的VIO-SLAM系统的相关进展,新的算法在特征匹配以及预积分方面做出了创新性的调整,取得了优秀的结果;其次,介绍了关于具有未知材质的物体重建技术的研究进展,并以此作为引子,深入探讨了如何在三维形体的AI自动创作任务中,巧妙地嵌入多视角几何约束,这一策略不仅保证了创作内容的多样性与创新性,更确保了生成结果的空间一致性与真实性;最后,展望了可控的大范围三维场景自动AIGC(Artificial Intelligence Generated Content)生成的广阔前景,这一技术若能与传统研究中的几何知识有效结合,将彻底改变人们创作与交互三维内容的方式,开启一个由AI驱动的三维内容创作新纪元。
图 10 李宏东教授线上作报告
吴毅红教授作了《多元SLAM:从鲁棒、轻量到模组及系统应用》的报告,分享了三维感知方面的最近工作进展,包括端到端SLAM矢量建图、SLAM无回环漂移误差抑制,概率线测量模型的视觉惯性里程计、基于较强泛化性能的外点剔除点云配准、较大场景的隐神经地图等鲁棒轻量理论方法。在关键点检测与描述方面的研究,介绍了一种结合概率分布形状的新方法,提高了关键点检测的鲁棒性和精度,并优化了训练时间和计算资源;在大尺度图像匹配中,介绍了一种基于注意力机制的匹配增强模块,通过尺度比值回归和图像变换,实现了大尺度下的精准匹配;在三维地图构建与点云配准方面,阐述了点云之间的特征一致性和种子关联选取方法,强调了在不同场景下高泛化性的点云配准技术;最后,展示了一些实际应用案例,包括在隧道、高速公路、手机和机器人上的应用,证明了其方法的有效性和实用性,并总结了研究成果,展望了未来将知识与数据进一步融合,在大模型的加持下,推动视觉主导的通用智能的发展。
图 11 吴毅红教授作报告
卢策吾教授作了《具身智能-感知(P),想象(I),执行(E)PIE方案与具身大模型探索》的报告,从具身智能体目前发展面临的主要问题:如何更好地理解真实世界的物理规则和如何处理大规模的数据信息出发,提出了基于感知(Perception)、想象(Imagination)和执行(Execution)三部分组成的具身智能技术方案。其中,感知部分通过对于人手和物体交互逻辑的建模帮助智能体理解了大量的物理常识,并能够对智能体采集到的图像初步进行概念上的压缩加速了后续的处理;想象部分自研了一个更适合于具身智能体部署的仿真引擎实现了对于现实世界柔性物体的高速准确仿真;执行部分则通过一个力反馈的硬件系统来进行力和位置的联合学习因此更好地实现了安全稳定的具身智能体反应和交互行为。最后,针对具身智能体的评价难以量化这一问题提出了实际场景真机检验的解决思路。
图 12 卢策吾教授作报告
秦学英教授作了题为《面向智能制造的混合现实交互技术》的报告,分享了在混合现实领域的最新研究与实践,针对混合现实技术在高端制造业和机器人领域的应用,提出了实物交互的新思路。首先,介绍了物理世界与虚拟世界的分离及其交互障碍,并指出混合现实作为桥梁的重要性。混合现实不仅增强了虚拟与现实的互动,还提供了一个三维空间的交互界面,提升了空间计算的准确性。随后,详细讲述了三维物体跟踪和姿态估计的重要性,尤其在工业环境中,针对传统的特征点检测方法在无纹理或复杂背景下的局限性,提出了基于CAD模型的跟踪方法,通过边缘检测和区域分割优化,实现了高精度的物体动态估计。最后,还介绍了在多视角环境下进行物体跟踪的策略,通过多视角联合优化显著提高了空间定位精度。在具体应用方面,展示了机器人在混合现实环境中的抓取实验,通过虚拟与现实结合的方式,解决了机器人在实际操作中的诸多挑战。同时,也提到了利用混合现实技术在制造业中的装配引导,显著提升了工作效率和精度。
图 13 秦英学教授作报告
主旨报告外,论坛还邀请了高飞、殷鹏、周易、弋力、刘浩敏、李弘扬6位SLAM相关领域的专家,为大家带来 6场特邀报告。
图 14 6位专家作报告
值得关注的是,本届论坛在正式开始前将引入3场别具一新的Tutorial:NeRF/3DGS及其在SLAM中的应用报告,由周晓巍研究员主持,分别邀请了浙江大学彭思达研究员、上海交通大学易冉助理教授、浙江大学廖依伊研究员为大家带来3场精彩的Tutorial。
图 15 3位报告专家作专题Tutorial
主旨报告与特邀报告后,每天的Panel环节,都会将会场的氛围带至高潮。今年论坛安排了两场Panel,来自学术界与企业界的11位专家围绕“大模型时代的SLAM:机遇与挑战”与“面向具身智能与混合现实的空间计算”主题纷纷发表自己的观点与看法,并与现场的参会者互动交流。
图 16 Panel 1现场
图 17 Panel 2现场
今年大会以多模块创新模式展示,包括SLAM竞赛论坛、大咖面对面、优秀论文分享与Poster展示、合作企业宣讲,深受大家好评。本届论坛SLAM竞赛,共有37支队伍报名,其中VI-SLAM赛道5支进入答辩,Lidar-SLAM赛道4支进入答辩,两个赛道分别设立了冠、亚、季军以及优秀奖 4个奖项,共9支队伍获奖。最终“幸运的深不见底”队、“Lenovo Research AR-SLAM”队、“VGA-SLAM”队分别获得VI-SLAM赛道的冠亚季军,“江淮前沿技术协同创新中心”、“Peach-SLAM”、“DUT-000”团队分别获得LiDAR-SLAM赛道的冠亚季军,“林海拓荒者”团队获得优秀奖。
图 18 获奖队伍颁奖
大咖面对面环节,邀请了20位嘉宾与参会同行面对面进行了深度沟通交流,平时科研或者学习中遇到的具体问题、自身发展中的迷茫、企业界目前落地的技术以及创新模式下传统技术如何进行革新等,都在该环节得到了充分探讨。
图 19 大咖面对面环节
优秀论文分享与Poster环节,给参会者带来了最新的顶级期刊/会议的成果展示。这些论文的作者们分享了论文的思路与亮点,并与参会者进行探讨。
图 20 优秀论文分享与Poster
合作企业技术宣讲环节,来自莫界科技、滴滴自动驾驶、数字绿土等行业的7家企业分别介绍了公司的技术发展情况和成果。通过这一环节,参会的高校师生能够近距离地了解企业界技术的发展方向以及前沿进展,参会的企业工程师也了解了同行的技术动态。
图 21 合作企业宣讲
上:莫界科技、滴滴、数字绿土
下:商汤科技、OUSTER、趋动云、度量科技
不知不觉,本届论坛将近尾声,我们相聚古都西安,共同致力于SLAM技术的创新发展,为大模型与SLAM2.0展望美好未来。第五届全国SLAM技术论坛圆满闭幕,期待下届SLAM技术论坛再见!相约深圳,共绘宏图!
图 22 参会代表合影
Copyright © 2025 中国图象图形学学会 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190