2025年1月17日,中国图象图形学学会第二十八期珠峰论坛—智能信息处理专题研讨会在南京理工大学成功举办。本次论坛由中国图象图形学学会主办,中国图象图形学学会青年工作委员会、南京理工大学智能信息处理与系统实验室与南京理工大学计算机科学与工程学院承办,高端工程机械智能制造全国重点实验室、社会安全信息与感知系统工信部重点实验室、江苏省社会公共安全科技协同创新中心协办。
本次论坛由南京理工大学计算机科学与工程学院姚亚洲教授和舒祥波教授共同担任执行主席,青海师范大学郑钰辉教授和中国地质大学唐厂教授担任主持人。论坛邀请了上海交通大学熊红凯教授、国防科技大学刘新旺教授、中国科学技术大学常晓军教授、华中科技大学王兴刚教授、哈尔滨工业大学(深圳)俞俊教授等五位国内领军级专家学者作专题报告,围绕智能信息处理等相关领域的前沿研究与创新主题进行深入探讨,并分享智能信息处理的前沿技术与应用前景。此次论坛吸引了来自全国各地的近50位专家学者、青年学者及高校师生代表,参与线上线下的交流与讨论。
下午的论坛开幕式由南京理工大学姚亚洲教授主持,并由南京理工大学计算机学院李泽超副院长和CSIG青工委赵才荣秘书长分别代表承办单位发表了开幕致辞。他们指出,本次论坛的主题“智能信息处理”在多媒体与计算机视觉领域具有深远影响。无论是论坛的主题安排还是专家的邀请,均经过精心策划,旨在为与会者呈现一场高水平、高规格、富有价值的学术交流盛会。
图 1 珠峰论坛现场
图 2 与会专家学者代表合影
图 3 姚亚洲教授主持开幕式
图 4 李泽超副院长致辞
图 5 赵才荣秘书长致辞
开幕式结束后,会议进入专题报告环节,该环节由青海师范大学郑钰辉教授和中国地质大学唐厂教授主持。
图 6 郑钰辉教授主持论坛
图 7 唐厂教授主持报告
熊红凯教授作了题为“智能与数学:后验与先验”的报告,深入探讨了深度神经网络与大模型的数学原理和技术思想。报告详细介绍了生成模型、扩散模型、几何深度学习、联邦学习以及大模型微调等前沿技术,特别强调了从统计学角度分析这些技术的核心原理。在报告中,熊红凯教授着重阐述了大模型的数学框架,讨论了后验与先验在模型训练过程中的重要性与应用,探讨了如何通过数学方法优化大模型的性能。此外,熊红凯教授还分享了大模型编码的最新进展,并展望了深度学习领域的未来研究方向,特别是跨学科交叉带来的创新机遇。报告内容涵盖了当今人工智能技术的关键发展与挑战,对与会者深入理解智能与数学相结合的理论体系,提供了极具价值的学术启发。
图 8 熊红凯教授作报告
刘新旺教授作了题为“聚类分析的理论方法及应用”的报告,深入探讨了聚类分析中面临的多样性、非完整性及弱可学习性等挑战。报告重点介绍了课题组在多视图聚类融合机理、非完整多视图聚类和深度聚类等领域的创新成果。刘新旺教授在报告中详细阐述了如何利用不同类型的数据特征改进聚类性能的新理论,并介绍了聚类填充方法,用于应对非完整多视图聚类中的数据缺失问题。此外,刘新旺教授还阐述了从原始数据中学习特征,以最优方式服务于聚类分析的新应用。报告的最后,刘新旺教授展望了未来聚类分析的研究方向,提出将开展持续聚类分析,以应对数据动态变化带来的挑战。此次报告为与会者提供了聚类分析领域的前沿理论与技术,极大丰富了大家对该领域最新进展的认识。
图 9 刘新旺教授进行远程在线报告
常晓军教授作了题为“基于视觉语言导航的具身智能探索”的报告,深入探讨了多模态大模型在具身智能领域的应用与发展。报告指出,随着多模态大模型的快速发展,具身智能系统在理解和处理复杂环境方面取得了显著进展,尤其是在环境感知和决策支持能力上得到了显著提升。常晓军教授在报告中详细阐述了多模态大模型如何融合视觉、语言及其他感知信息,从而为机器人、自动驾驶等实际应用领域提供更强大的支持。常晓军教授分析了该技术在信息融合、任务执行和人机交互中的具体应用场景,展示了相关研究的最新成果和实际应用案例。报告最后,常晓军教授展望了未来智能系统的发展趋势,提出了多模态大模型在具身智能中的潜力和前景,为未来技术的创新与应用提供了宝贵的见解与启示。
图 10 常晓军教授作报告
王兴刚教授作了题为“轻量化多模态状态空间大模型”的报告,深入探讨了多模态大模型在通向通用人工智能的关键路径上,如何通过轻量化和高效化的策略应对现实挑战。报告特别聚焦于状态空间模型(State Space Models, SSMs),这一新兴技术为打造高效的轻量化多模态大模型提供了可行的解决方案。王兴刚教授在报告中详细介绍了状态空间模型与传统Transformer模型的比较,指出SSMs在计算和空间复杂度上的优势。与Transformer模型的二次方计算复杂度不同,SSMs具备线性复杂度,且能够实现与Transformer相当的建模能力。王兴刚教授进一步展示了SSMs在语言模型、视觉表征及多模态扩展等领域的优异表现,强调了其在推理成本上的巨大优势。报告最后,王兴刚教授回顾了多模态状态空间大模型的发展历程,并展望了这一技术的未来应用前景,为与会者提供了对这一新兴领域的深入理解。
图 11 王兴刚教授作报告
俞俊教授作了题为“大模型驱动下的多模态推理”的报告,深入探讨了多模态大模型在具身智能系统中的应用及其带来的变革性进展。报告指出,随着多模态大模型的快速发展,具身智能系统在理解和处理复杂环境方面取得了显著提升,尤其是在环境感知与决策支持方面,表现出了前所未有的优势。俞俊教授详细介绍了多模态大模型如何融合视觉、语言和其他感知信息,为具身智能系统提供更强的能力,尤其在机器人技术、自动驾驶等多个领域展现了巨大的应用潜力。报告中,俞俊教授分析了多模态大模型在信息融合、任务执行和人机交互中的具体应用场景,展示了多个实际案例,揭示了其在提升任务执行效率和优化人机交互体验中的核心作用。报告最后,俞俊教授展望了多模态推理技术的未来发展趋势,提出了这一领域在推动智能系统向更高层次进化中的潜力,为与会者提供了宝贵的研究启示和实践思路。
图 12 俞俊教授作报告
此次论坛聚焦于智能信息处理专题展开,深度探讨了智能信息处理领域的前沿研究与创新主题,涵盖了多模态大模型、高效训练与压缩、具身智能、跨领域医学AI等多个方向,为参会的专家学者及师生提供了深入的学术交流平台。论坛通过一系列精彩的报告,促进了思想的碰撞与讨论,为智能信息处理技术的研究提供了新的视野。在报告后交流环节,与会代表们积极互动,共同探讨了智能信息处理等相关领域未来发展的趋势与挑战,展望了智能系统跨学科融合带来的创新机遇。中国图象图形学学会第二十八期珠峰论坛的成功举办,为人工智能与机器学习领域的研究人员提供了一个极佳的交流平台,进一步促进了相关领域的“产学研”合作,为未来智能系统的创新与发展奠定了坚实基础。
Copyright © 2025 中国图象图形学学会 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190