为促进学术交流、开拓学术视野、激发创新思维,助力图像图形领域研究生学术成长和未来职业发展,中国图象图形学学会(CSIG)创办CSIG学生会员分享论坛,论坛以研究生自主开展学术交流为主,同时,积极发挥导师的指导作用,帮助研究生开阔视野,启迪智慧,提高创新能力。
CSIG第十九期学生会员分享论坛将于2025年11月28日举办,邀请到了中山大学博士生付盛豪、南京理工大学博士生徐斌倩、华中科技大学博士生汪先奇作精彩学术报告,并邀请电子科技大学邱荷茜副教授、厦门大学纪家沂博士后研究员、上海交通大学杨学助理教授担任评议嘉宾对研究工作作出点评并解惑,活动由罗根博士后研究员主持,共同围绕研究生学术生涯的热点话题进行探讨。
主办单位:
中国图象图形学学会(CSIG)
承办单位:
CSIG优博俱乐部
CSIG会员发展与服务工作委员会
CSIG青年工作委员会
会议时间:
2025年11月28日(星期五)9:00-11:30
会议地点:
线上地址1(腾讯会议):823 408 716
线上地址2(CSIG视频号直播):
欢迎关注CSIG官方视频号,观看直播

线上地址3(寇享学术直播):

会议议程


邱荷茜 副教授 电子科技大学
邱荷茜,电子科技大学信息与通信工程学院副教授,硕士生导师。入选CSIG博士学位论文激励计划提名、首批四川省博新计划,中国博士后特别资助(站前)。从事多媒体智能信息处理方向研究,在IEEE Transactions、CVPR、ICCV等国际重要期刊和会议发表论文50余篇,获CVPR2024W最佳论文,CVPR2023亮点论文,ICIP2024 最佳论文候选。申请与授权国家发明专利25项。承担科技部2030新一代人工智能重大项目、国家自然科学基金联合基金重点、重点基金、青年基金、中国博士后科学基金等10余项项目。先后荣获吴文俊人工智能科技进步一等奖、中国航天大会思源联盟优秀成果以及多项国内外学术竞赛冠军等奖励。担任CAAI智能成像专委会委员、CSIG女工委委员、CSIG多媒体专委会委员等。

纪家沂 博士后研究员 厦门大学
纪家沂,厦门大学博士后,隶属于多媒体感知与高效计算教育部重点实验室,目前在新加坡国立大学NExT++ 研究中心兼任博后。博士毕业于厦门大学,师从纪荣嵘教授。长期从事计算机视觉和多模态处理领域研究。主持国家自然科学基金青年基金项目和博士后面上基金,博士后创新人才支持计划进入会评环节,作为骨干成员参与科技创新2030—“新一代人工智能”重大项目。共发表顶级会议期刊论文超过40篇,包括CVPR、ICCV、NeurIPS、ICML和TIP等。担任ACM MM 2025的Proceeding Chair,(曾)担任ACM MM 2024,NeurIPS 2025,ACM MM 2025和CVPR 2026等CCF-A类会议领域主席,曾担任CVPR、ICCV、ECCV、NeurIPS、ICLR、ICML、ACL、TPAMI和TCSVT等顶级会议期刊的审稿人,担任2024中国媒体大会、第三届机器学习算法与自然语言处理大会和2025年图像图形学大会的论坛主席的论坛主席。

杨学 助理教授 上海交通大学
杨学,上海交通大学长聘教轨助理教授,主持国自然及上海市青年基金项目,曾入选第十届中国科协青年人才托举工程、CCF优博、上海交通大学优博,全球前2%顶尖科学家榜单和爱思唯尔中国高被引学者名单。研究方向为计算机视觉、多模态大模型。在CCF-A类期刊和会议上发表50余篇论文(包含最具影响力AAAI21论文榜首),谷歌学术引用近万次,任ICLR/AAAI领域主席。

付盛豪 博士研究生
报告题目:基于多模态大模型的人物感知、推理与交互
报告摘要:现有的多模态大模型能够准确地感知与理解客观的物理世界和自然规律,而人作为物理世界中的重要主体,多模态大模型仍然难以准确感知。我们团队以人为中心,通过一系列工作,让多模态大模型先学会感知人的外在表现,进而深入理解人的内心想法,进而更好地与人进行交互。(1)首先,准确感知人物的外在表现是基础。与人交互时,人物的表情、情绪、行为和语言是最基本的外在表现。我们提出HumanOmni,该模型通过三分支结构,自适应地融合人体不同部位的视觉信号和音频信号,在自建数据集上训练后,能够准确理解人物外在表现。(2)其次,理解人物内心想法是关键。我们提出HumanOmniv2,该模型利用GRPO技术,让模型先感知人物外在表现,然后基于此进行推理,从而理解人物的内心想法和意图。(3)最后,高效地与人交互是目的。我们提出视觉指令反馈任务,让多模态大模型能够从视频画面中捕捉视觉指令,从而与人们达到全模态的交流。综上,通过对人全面的感知与分析,多模态大模型能够更有情商,也能够更好地与人们交互。
个人简介:付盛豪,现为中山大学计算机学院四年级博士研究生,导师为郑伟诗教授和谢晓华教授。目前,他主要的研究方向包括2D目标检测(通用目标检测和开放词汇检测)和多模态大模型(全模态感知与推理),研究产出的多篇论文以第一作者身份发表于CVPR、ICCV、NeurIPS、TMM等高水平会议、期刊,其中一篇论文入选CVPR2025 Highlight,同时他也担任CVPR、ICCV、NeurIPS等CCF-A类会议审稿人。

徐斌倩 博士研究生
报告题目:复杂异构场景下的高效联邦微调
报告摘要:近年来,大语言模型(LLMs)在多种任务中展现出卓越的表征与泛化能力,但其庞大的参数规模与高昂计算开销,使其难以直接应用于多源分布式环境。联邦微调作为兼顾隐私保护与个性化定制的重要范式,为大模型协同优化提供了新思路。然而,实际应用中客户端存在领域差异、模态不一致与资源不均衡等异构约束,使高效、稳定的联邦微调面临挑战。本次报告以“复杂异构场景下的高效联邦微调”为主题,围绕低秩适配(LoRA)的高效参数化机制,介绍我们在跨领域适应、模态协同、资源优化及一次通信联邦微调等方面的研究进展。报告将阐述如何结合大模型结构与轻量化适配策略,实现低通信开销下的高效泛化与个性化提升,并探讨其在视觉与多模态任务中的应用前景。
个人简介:Binqian Xu is currently a Ph.D. candidate in the School of Computer Science and Engineering at Nanjing University of Science and Technology, China. She is also a visiting scholar at the National University of Singapore. Her current research interests include computer vision, action recognition, and federated learning. She has authored several journal and conference papers in these areas, such as in IEEE TPAMI, IEEE TIP, IEEE TNNLS, NeurIPS, and ICCV.

汪先奇 博士研究生
报告题目: 开放场景下的泛化立体匹配方法研究
报告摘要:立体匹配旨在从一对图像中预测稠密、准确的视差图,从而恢复场景的绝对深度信息。作为三维感知的核心技术,其在自动驾驶、无人机导航等领域具有至关重要的作用。然而,当前方法依赖于仿真数据集和有限的真实数据集,仅凭匹配无法面对复杂多变的开放场景,在缺乏匹配信息的区域频频失效。为此,我们首先提出了单双目融合的立体匹配方法,充分运用单目大模型的几何先验;其次,针对数据集稀缺问题,我们提出了基于扩散修补的立体匹配数据生成框架,从数据驱动层面解决方法泛化能力弱的问题;最后,我们设计了一个移动端友好的立体匹配模型,能够实际应用于无人机等小型设备。通过一系列研究,我们成功提高了立体匹配方法在开放场景下的泛化能力。
个人简介:汪先奇,华中科技大学人工智能与自动化学院博士导师为杨欣教授。目前,他的主要研究方向包括立体匹配和多视角深度估计,已发表CCF A类期刊/会议论文九篇,涵盖CVPR、ICCV、TPAMI等高水平会议、期刊,其中一作单篇最高引用达一百余次。在学术任职方面,担任CVPR、ICCV、NeurIPS等多个顶级国际会议的审稿人。

罗根,曾任上海人工智能实验室博士后研究员,博士毕业于厦门大学,师从纪荣嵘教授。研究方向为跨媒体计算,围绕该方向在TPAMI, IJCV, CVPR, ECCV及 NeurIPS等CCF推荐期刊和会议发表论文30余篇,谷歌学术引用2200余次,其中7篇论文被CVPR, ECCV和NeurIPS等领域顶会评为口头报告 (Oral Paper),主持首届国家自然科学基金青年学生基础研究项目(博士研究生项目)、博士后面上项目等,入选博士后创新人才支持计划,获评CSIG优博提名奖,上海市“超级博士后”等。曾负责厦大思源大模型的开发,负责上海人工智能实验室书生·万象系列的多模态大模型研发。
Copyright © 2025 中国图象图形学学会 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190