2025中国图象图形学学会第八期“青托论坛”暨厦门理工学院电子信息学科建设论坛在厦门成功举办

学会动态

2025中国图象图形学学会第八期“青托论坛”暨厦门理工学院电子信息学科建设论坛在厦门成功举办

发布时间：2025-12-16 来源：中国图象图形学学会分享：

12月13日，由中国图象图形学学会（CSIG）主办，厦门理工学院、福建省模式识别与图像理解重点实验室、CSIG青年工作委员会、CSIG青托俱乐部、CSIG厦门会员活动中心、福建省医疗数据挖掘与应用工程技术研究中心、数据挖掘与智能推荐福建省高校重点实验室、厦门市软件供应链安全公共技术服务平台联合承办的2025年第八期中国图象图形学学会青托论坛暨厦门理工学院电子信息学科建设论坛在厦门举行。中国图象图形学学会副理事长北京大学彭宇新教授、东北大学副校长王兴伟教授、清华大学韩军功教授、国防科技大学刘新旺教授、南京理工大学李泽超教授、天津理工大学高赞教授、东南大学魏秀参教授、厦门大学温程璐教授等来自18所高校和机构的近240位专家、学者和研究生参加了论坛，本次论坛由厦门理工学院计算机学院院长王大寒教授和CSIG青托俱乐部主席东南大学魏秀参教授联动组织。

参会人员合影

13日上午8点30分，第八期CSIG青托论坛在厦门理工学院集美校区信息中心报告厅正式开始。本次论坛由厦门理工学院王大寒教授主持。

王大寒教授主持论坛

厦门理工学院副校长朱顺痣教授发表致辞，他指出，人工智能与数字技术正深刻重塑电子信息学科的面貌，青年学者在计算机视觉、模式识别、具身智能、大模型等领域取得了多项突破性成果，是未来的科研生力军和重要力量，本次论坛在中国图象图形学学会的指导下，为青年人才提供了宝贵的交流和学习的机会，也将为我校电子信息领域学科发展提供新的动力。

朱顺痣副校长致辞

CSIG副理事长、北京大学彭宇新教授发表致辞，他表示通过在不同高校举办青托论坛、介绍前沿技术，能够有效促进各高校之间的广泛交流，且本次论坛通过与厦门理工学院电子信息学科建设论坛进行联通，能有效达成互相受益的目的。

彭宇新教授致辞

CSIG青托俱乐部主席魏秀参教授代表俱乐部进行发言，他围绕青托俱乐部的定位与使命，简要回顾历届论坛举办情况，介绍当前重点工作部署，并对本次论坛圆满召开致以美好祝愿。

魏秀参教授介绍青托俱乐部情况

随后，本次论坛活动正式进入报告环节，上午场共有4位知名学者做了主旨报告。首先，北京大学彭宇新教授作了题为《剖析Gemini 3：技术、挑战与启示》的学术报告。报告以2025年全球大模型发展态势为切入，指出行业竞争正由“智力竞赛”逐步转向“成本竞赛”，并结合Gemini 3的实践表现，系统解读其实现性能与体验提升的关键路径。彭宇新围绕原生多模态、深度思考与推理、智能体规划三项技术亮点，剖析Gemini 3性能突破背后的原因，同时通过案例揭示其在视觉内容理解与生成方面仍面临的关键挑战。针对相关问题，报告进一步介绍团队在细粒度图像识别、图像思考与运动可控视频生成等方向的最新研究进展，并总结Gemini 3对大模型领域带来的启示，为国产大模型的发展提供参考，引发与会专家的热烈讨论与深入思考。

彭宇新教授作报告

国防科技大学刘新旺教授做了题为《聚类分析的理论、方法及应用》的学术报告。报告聚焦聚类分析面临的算法理论研究浅、复杂场景建模难以及新兴任务挖掘不足等挑战，系统介绍课题组在聚类领域的理论算法研究、复杂场景建模与新兴任务定义等方面取得的一系列创新成果。刘新旺从“两个新范式、两种复杂场景、两个新任务”三个层面展开阐述：一方面提出基于概率二部图的多视图聚类方法以及样本自适应与局部核对齐的多核优化新范式；另一方面面向属性完全缺失场景与联邦场景，设计了具有鲁棒性的聚类算法；同时定义了面向深度时序图与结构化知识的两类无监督学习新任务，为复杂数据分析与智能应用提供了重要方法支撑。

刘新旺教授作报告

清华大学韩军功教授做了题为《多模态智能：从任务专用模型到通用智能框架》的学术报告。报告指出，随着视觉、语言、深度等多源数据日益互联，如何理解并融合多种感知输入以实现对环境的感知、理解与交互，已成为人工智能研究的重要方向。韩军功围绕多模态智能的关键问题，系统梳理了该领域在模型架构、融合策略、典型应用以及多模态基础模型等方面的最新进展，展示相关研究如何持续突破机器感知与认知的边界。最后，他进一步探讨面向通用智能框架构建过程中跨模态学习、鲁棒性、上下文感知及类人理解能力等核心挑战与发展机遇，为与会师生拓展了多模态智能研究的视野与思路。

韩军功教授作报告

南京理工大学李泽超教授做了题为《具身视觉定位与分割》的学术报告。报告指出，近年来具身智能作为人工智能与机器人交叉融合的重要方向，受到学术界与产业界的广泛关注；具身智能将人工智能融入机器人等物理实体，赋予其感知、学习与环境动态交互能力，而对象识别、位置定位与场景理解等感知任务在开放场景中仍面临诸多挑战。围绕上述问题，李泽超重点介绍团队面向具身智能开放场景的视觉定位与分割研究进展，涵盖上下文解耦的鲁棒视觉定位、语义分割、知识迁移以及多模态融合等关键技术，并结合实际业务开放场景展示相关方法的应用效果，为具身视觉技术的发展提供了新的思路与参考。

李泽超教授作报告

在上午场报告结束后，根据CSIG青托论坛的服务宗旨，特设立青年学者服务环节，邀请彭宇新教授、韩军功教授、刘新旺教授、李泽超教授、高赞教授等多位领域内知名专家对3位青年学者的国家自然科学基金青年项目（C类）和面上项目的申报材料进行点评和指导。来自厦门理工学院的肖顺鑫博士、张锴博士、雷凌光教授依次登台，系统展示了项目的总体情况以及各自在相关研究领域取得的最新进展与创新成果。各位资深专家认真听取青年人才的报告，并围绕其研究思路、方法设计及学术价值等方面，逐一提出了深入细致且极具建设性的指导意见。这些意见不仅帮助青年学者更清晰地把握研究中的关键问题，也为其后续工作指明了方向。该环节的成功组织，有效构筑起青年学者与领域专家之间面对面交流的高质量平台，既推动了前沿学术观点的深度交融，也为青年科研人才的学术成长注入了实质性支持与动力。

指导专家点评

在青托论坛下午场，共6位青年学者进行了学术分享。中国科学技术大学周文罡教授做了题为《基于大模型的手语视频问答关键技术研究》的学术报告。报告指出，手语作为重要的视觉语言，是聋人群体日常交流的关键载体；面向手语视频的智能问答旨在理解并生成手语内容，构建听人和聋人之间的沟通桥梁。周文罡围绕手语视频问答的核心需求与关键环节，系统梳理手语视频翻译、手语转写翻译以及手语视频合成等关键技术方向，分析该任务在多模态理解、生成一致性与语义对齐等方面面临的技术挑战。最后，报告介绍团队近期在基于大模型的手语视频问答任务上的研究探索，并展示智能手语相关应用尝试，为推动无障碍智能交互与手语信息服务落地提供了新的思路与参考。

周文罡教授作报告

清华大学计算机系王鑫副研究员做了题为《课程机器学习研究》的学术报告。报告指出，传统机器学习训练仍普遍面临数据噪声与数据分布外泛化两类核心挑战。王鑫首先系统分析现有方法在应对噪声干扰与分布偏移方面的局限性，指出其往往依赖隐式样本调整，因而容易受噪声样本影响且难以动态适应目标分布。针对上述问题，报告引入课程学习的研究视角，提出通过显式且自适应地调节样本选择与权重，实现对训练过程的主动控制。最后，报告提出课程机器学习的系统框架与方法体系，展示其在应对噪声、分布偏移及复杂任务等方面的优势，并为提升机器学习在真实世界场景中的自适应性提供了理论依据与实践路径。

王鑫副研究员作报告

中山大学任文琦教授做了题为《大模型生成的内容安全与深度伪造检测》的学术报告。报告围绕“大模型生成安全”这一核心议题，从风险揭示与安全防御两个维度展开系统阐述：在风险揭示方面，报告深入剖析当前大模型安全机制的薄弱环节，结合“越狱”等现象的分析与实例说明，揭示模型在理解用户指令过程中可能存在的安全盲区及由此带来的违规生成风险；在安全防御方面，报告梳理生成内容检测与深度伪造识别的关键技术路径，介绍团队在提升检测准确性与鲁棒性方面的研究进展，并探讨构建高效“生成内容防火墙”的方法思路。最后，报告总结大模型生成安全领域的最新进展与发展方向，为构建更安全、可信、可控的AIGC系统提供了重要参考。

任文琦教授作报告

中国科学院自动化研究所张煦尧研究员做了题为《开放环境模式识别》的学术报告。报告指出，模式识别正面临从静态封闭环境走向动态开放环境的关键转变，开放环境的动态性、不确定性与演化性对传统方法提出了新的挑战。张煦尧围绕开放环境模式识别的核心思想，系统阐释了通过置信度估计实现已知与未知的有效区分、通过新类别自动发现从数据中获取新知识、以及通过类别增量学习持续提升模型能力的技术路径。最后，他提出“边界评估—知识发现—能力进化”的闭环学习框架，推动模式识别由被动识别迈向主动认知，为开放世界智能感知研究提供了有益参考。

张煦尧研究员作报告

中国科学院自动化研究所梁坚副研究员做了题为《可信大模型推理进展》的学术报告。报告指出，随着大语言模型等生成式人工智能技术快速发展，模型推理能力日益成熟，正在推动人机交互与应用范式发生深刻变革；然而，要使此类模型在关键领域实现安全、可靠落地，可信性仍是亟需突破的核心瓶颈。围绕推理大模型的可信性主题，梁坚系统梳理并深入分析模型在鲁棒性、公平性、可解释性与安全性等关键维度面临的主要挑战与研究进展。最后，报告展示了两项在多模态推理模型方向的最新工作，为相关领域的后续研究与应用提供了有益启发。

梁坚副研究员作报告

西北工业大学曹聪琦副教授做了题为《面向开放世界的智能视频理解：识别、检测及预测》的学术报告。报告指出，在开放世界场景下，视频理解仍面临时空协同建模困难、静态偏差较大、分布外泛化与复杂场景推理能力不足等多重挑战。围绕上述问题，报告系统介绍在开放世界视频理解方面的一系列最新研究进展：从面向开放词汇的行为识别多模态时空协同建模，到提升分布外泛化能力的静态去偏方法；从场景依赖的视频异常检测与预测，延伸至复杂场景感知的统一异常理解框架。最后，报告展示多模态大模型与生成模型在动态开放环境中实现视频多维度协同理解的巨大潜力，并对未来研究方向进行了展望，为开放世界视频智能感知研究提供了新的思路与借鉴。

曹聪琦副教授作报告

与此同时，在同期举办的学科建设论坛上，与会专家对厦门理工学院的电子信息学科建设提出了宝贵意见和建议。最后，朱顺痣副校长和曾焕强副校长向各位莅临报告的专家学者以及积极参会的师生表示衷心感谢。本次论坛与厦门理工学院电子信息学科建设深度融合，既延续了青托论坛聚焦前沿、赋能青年的学术基因，又紧扣电子信息学科发展的国家战略需求，为学科建设与人才培养搭建起高水平交流的桥梁。至此，本次论坛顺利完成各项议程并圆满闭幕。

“CSIG青托论坛”活动介绍

“CSIG青托论坛”是由中国图象图形学学会（CSIG）主办、CSIG青托俱乐部发起的品牌学术活动，旨在推动中国图像图形学领域的科技进步、鼓励创新性研究、促进青年人才成长，邀请历届青托入选者及国内外其他优秀科研工作者，为青年学者们提供学术交流与研讨的平台，促进学者之间的交流与合作。每季度举办一次，全年四期。活动面向图像图形学领域研究者开放申请，如您有意申请并组织“CSIG青托论坛”活动，请与中国图象图形学学会青工委或青托俱乐部联系。

联系人：魏秀参（weixs@seu.edu.cn）、徐婧林（xujinglin@ustb.edu.cn）