登录会员系统  |  联系我们  |  加入学会  
学会动态
CSIG合肥-高水平论文分享会(ACM MM2025)成功举办
发布时间:2025-09-10      来源:中国图象图形学学会      分享:

1757469149145770.png

参会人员合影

2025年9 月 4 日下午,由中国图象图形学学会(CSIG)主办、CSIG 合肥会员活动中心与安徽大学联合承办的“CSIG合肥-高水平论文分享会(ACM MM2025)”在安徽大学成功举办。本次分享会共邀请了来自安徽大学、合肥工业大学、中国科学技术大学等10 位 ACM MM 2025 录用论文的第一作者或核心贡献者登台报告。安徽大学、安徽建筑大学、安徽理工大学、安徽医科大学、安徽中医药大学、合肥大学、合肥工业大学、合肥师范学院、中国科学技术大学等多所高校的 60 余位师生到场参会。会议由合肥工业大学的程乐超副教授和安徽大学的孙井鹏讲师共同主持。

1757469169142718.png

活动现场 

会议伊始,由CSIG 合肥会员活动中心主席、安徽大学汤进教授致辞。汤教授指出,CSIG合肥会员活动中心始终秉持“为广大师生提供更好的服务”的宗旨。他勉励在座同学借助今天这样的会议契机,不仅要听懂台上的论文,更要主动走向邻座的同学,交换问题、碰撞思想,让CSIG合肥会员活动中心真正成为大家找方向、找合作、找朋友的平台。他表示,CSIG合肥会员活动中心将持续搭建“小而精”的常态化交流平台,让更多的研究生在这里找到科研引路人,遇到志同道合的伙伴,共同推动合肥地区多媒体与人工智能研究再上新台阶。

随后,10 位嘉宾围绕视频情感分析、跨模态检索、RGB-事件感知、脑机接口、推荐系统等热点方向分享了他们的最新研究成果。

1757469184610538.png 

黄晅东同学作分享

首先,来自中国科学技术大学的黄晅东同学分享了他们在视频情感分析方向的最新工作《EmoDETective: Detecting, Exploring, and Thinking Emotional Causes in Videos》。该工作为了解决现有视频情感分析方法缺乏对情感成因的描述,限制了解释性和推理能力,构建首个大规模视频情感成因数据集,覆盖音频、视觉、内容和镜头四大类、12个子属性,并形成“情感因果链”以增强推理,并提出了多模态大语言模型 EmoDETective,其采用渐进式学习策略,实现了更精准的情感理解,为视频情感分析提供了新思路。

1757469206483290.png 

袁学宇同学作分享

合肥工业大学的本科生袁学宇同学分享了题为《DFGAP: Towards Depth-Free Cross-Category GAParts Perception via Uncertainty-Quantified Modeling》的论文,该论文提出了一种基于 RGB 输入的深度无关分割与姿态估计框架,其以纯 RGB 输入实现深度无关的跨类别部件感知,为 GAParts 感知开辟了全新的研究范式,并有望在多种具身智能系统中得到广泛应用。

1757469225415954.png 

邓一飞同学作分享

安徽大学的邓一飞同学带来了他们在多模态行人检索方向的最新工作《Learning Hierarchical Cross-modal Association with Intra-modal Context for Text-Image Person Retrieval》。为了解决现有文本-图像行人检索方法通常忽视了不同样本之间语义相关性的细粒度差异,本文提出了一种层次化的跨模态关联方法。该方法利用单模态预训练模型提取的模态内细粒度语义关系,来约束图像与文本模态之间的层次化跨模态关联,从而实现更精确的检索,为方向的发展提供了新的研究范式。

1757469330158183.png 

章胜同学作分享

从脑电信号中解码语音是医学与神经科学领域的重要目标,尤其为脑损伤、中风或神经退行性疾病导致失语的患者带来了沟通希望。安徽大学的章胜同学分享了他们在该方向的最新研究《DMF2Mel: A Dynamic Multiscale Fusion Network for EEG-Driven Mel Spectrogram Reconstruction》,该工作突破了现有技术仅能在词或字母层面重建听觉刺激响应的局限,实现了精确的分钟级连续想象语音特征重建,为非侵入式脑机接口的连续语音重建提供了有效解决方案。

1757469364917420.png

徐硕同学作分享

安徽大学的徐硕同学分享了他们在多标签图像分类方向上的新发现,并作了题为《Towards Space and Semantics: Object-Purified Representation Learning for Multi-Label Image Classification》的报告。他们发现对象在空间和语义关系上会受到上下文内容和共现对象的影响,导致模型性能不佳。为此,他们提出了一种对象纯化表示学习框架,其通过采用空间纯化注意力、语义关联纯化模块来消除与对象无关的特征激活,增强对象感知能力,有效提升了分类性能。

1757469384836342.png

解英杰同学作分享

安徽大学的解英杰同学分享了他们听觉注意力检测方向上的最新工作《DHGCN: Dual HyperGraph Convolutional Network for EEG-Based Auditory Attentio Detection》。为了解决现有方法难以有效处理多通道EEG信号的离散布局和不规则空间拓扑结构,本报告提出了一种名为 DHGCN 的双超图卷积网络,该网络由超图建模模块、双分支超图学习(DHGL)模块和特征融合模块组成,其能够通过EEG信号捕捉复杂的时空依赖关系以及脑区之间的高阶非线性关系,实现在多说话人环境中准确识别被注意的目标说话人。

1757469399713778.png

吴文滔同学作分享

安徽大学的吴文滔同学分享了他们在RGB-事件感知方向的最新研究《CM3AE: A Unified RGB Frame and Event-Voxel/-Frame Pre-training Framework》。他们提出了一种新的预训练框架,其接受 RGB 图像、事件图像和事件体素等多模态数据作为输入,为基于事件的下游任务以及 RGB-事件融合任务提供了强有力的支持,并在五个下游任务上证明了该方法的有效性。

1757469419799710.png

陈慧临同学作分享

合肥工业大学的陈慧临同学作了题为《I3-MRec: Invariant Learning with Information Bottleneck for Incomplete Modality Recommendation》的论文分享,为了解决多模态推荐系统由于模态缺失导致的鲁棒性和泛化能力不足的问题。本报告提出了一种名为 I³-MRec 的方法,其结合不变性学习与信息瓶颈原理,来应对模态缺失的推荐场景。该方法通过跨模态偏好不变性建模与紧凑有效的多模态表征,在减少对单一模态依赖的同时,保证了用户偏好一致性。

1757469440774241.png

盛天磊同学作分享

合肥工业大学的盛天磊同学分享了他们在矢量平面图自动生成方向的新工作《Synthesizing Vector Floorplans by Patch-Based Floorplan Segmentation》。针对现有矢量平面图自动生成方法往往依赖复杂的后处理,难以实现端到端的设计流程问题,本报告提出了一种基于分块分割的矢量平面图生成框架。该方法通过“划分—标注”两阶段策略,在设计约束下先划分空间,再赋予语义标签,实现了生成质量与效率的双提升,为空间设计提供了有效的工具。

1757469456421407.png

叶骋同学作分享

中国科学技术大学的叶骋同学分享了他们在情感视频字幕生成方向的工作《Multi-round Mutual Emotion-Cause Pair Extraction for Emotion-Attributed Video Captioning》。针对现有方法忽略了隐含在视频中的情绪成因的现象。本报告提出一种多轮交互的情绪-成因对提取网络,通过两轮迭代学习联合建模情绪线索与视觉成因,有效提升了模型在复杂语义理解与情绪感知方面字幕的生成质量,为该方向的发展提供了新的研究思路。

为了方便参会者与分享嘉宾的互动交流,本次会议在每位嘉宾分享后均设置了提问环节,现场听众对自己感兴趣的方向跟嘉宾进行了有效的交流。

wechat_2025-09-12_172028_552.png

wechat_2025-09-12_172043_670.png

 现场互动交流

此外,考虑到本次参会人员大多为在读研究生,本会议还特别设置了题为《从“小白”到“有靠山”:低年级研究生如何找到自己的科研引路人?》的panel交流讨论环节,五位嘉宾分别分享了读研读博经历、科研经验以及与导师、团队合作的故事,随后现场参会同学与嘉宾进行了互动交流。

1757469534367825.png

Panel交流讨论

此次会议CSIG 合肥会员活动中心还建立了“CSIG合肥高水平论文学生交流群”,持续为同学们提供讨论、交流、互助的平台支持(微信群链接:https://www.wjx.cn/vm/eZCqEtf.aspx#)。活动最后,主持人孙井鹏作了总结发言,并预告CSIG合肥会员活动中心将围绕更好地为学生发展提供服务,开展一系列举措,为本次分享会画上了圆满的句号。

本次分享会不仅搭建了高水平科研成果展示平台,更进一步凝聚了合肥及周边地区多媒体领域的研究力量。CSIG 合肥会员活动中心将持续以“小范围、深交流、重实效”为原则,助力青年学者快速成长,服务区域科技创新。



Copyright © 2025 中国图象图形学学会 京公网安备 11010802035643号   京ICP备12009057号-1

地址:北京市海淀区中关村东路95号 邮编:100190

技术支持:中科服