一、活动简介
“CSIG图像图形中国行”是由中国图象图形学学会主办的学术活动,旨在推动图像图形学科的普及,加强各高校研究所以及企业间的交流。自2017年4月起至今,分别在大连理工、哈尔滨工业大学、兰州大学、杭州电子科技大学、北京交通大学、海南大学、福州大学、西北农林科技大学等成功举办了100余期,线上线下参会人数累计数万人次,受到业界好评。本次“CSIG图像图形中国行”由人机交互专业委员会与中原工学院人工智能学院联合承办,交流主题为“AI大模型与人机交互”。
主办单位:中国图象图形学学会(CSIG)
承办单位:中原工学院人工智能学院
会议时间:2025年10月18日14:00
二、执行主席
刘军发 教授
个人简介:刘军发,工学博士,中原工学院人工智能学院教授,织物电子与智能穿戴研究中心副主任,多模态人机交互智能研究所所长。2009年博士毕业于中科院计算所,留所工作。曾任中科院计算所副研究员,硕士生导师。2011年在新加坡南洋理工大学任访问学者。主持、参与十多项国家自然科学基金与“863”计划项目,在国际国内学术期刊发表论文100余篇,拥有发明专利30余项,百度H指数21。曾获ACM KDD Cup2004国际竞赛第一名,ICDM国际数据挖掘大赛2009单项指标第一名,亚太人工智能大会PRICAI 2006年“最佳应用论文奖”,项目曾获2015年“北京市科技进步二等奖”,2016年“中国卫星导航协会科技进步一等奖”。是IEEE/ACM会员,CCF高级会员,人机交互专委会委员,YOCSEF委员。中国人类工效学学会智能穿戴与服装人因工程专业委员会常务委员,全国专业标准化技术委员会委员。
三、特邀专家
周宇 教授
个人简介:周宇,南开大学计算机/密网学院教授、博导,北京中关村学院共建导师;哈尔滨工业大学计算机系本硕博,上海交通大学博士后,2012.04-2024.05于中科院信工所先后任助研、副研、硕导、博导、研究员;中国图象图形学学会文档图像分析与识别专委会常务委员、副秘书长。研究方向为计算机视觉、多模态人工智能、具身智能、自然语言处理、大模型及深度学习等,近期聚焦于可视文本处理/检测/识别/理解/安全(OCR)、多模态大模型(含理解与生成)、多模态智能体、终身学习、自监督学习等主题。研发的场景文本提取系统、GUI Agent、特定目标检测系统、钓鱼网站检测系统等应用于多个国家部委及企业,发挥关键作用。在国内外高水平会议及期刊如CVPR/ICCV/NeurIPS/ICML/ICDAR/IJCV/TMM等发表学术论文近100篇,其中在CCF-A类/SCI一区会议期刊发表论文近50篇,获得CCF-A类会议ACM MM 2021最佳论文提名奖(5/1942篇)、ACCV IWRR 2014最佳论文奖。团队核心技术获得ICDAR 2025复杂版面文档图像端到端机器翻译冠军、CSIG 2022票据识别与分析挑战赛冠军、2020年“中国人工智能·多媒体信息识别技术竞赛”手写&印刷文本OCR两项高校组冠军、ICDAR ReST 2023印章主体文字检测第三名等近10项学术竞赛奖项。主持国家重点研发计划课题&子课题、国家自然科学基金面上&青年基金项目、国家部委重大工程课题、中国博士后科学基金、企业委托等项目/课题多项。
报告题目:多模态文档大模型幻觉问题及缓解方法研究
报告摘要:多模态大模型在处理可视文本相关任务时,主流"编码-解码"架构过度依赖语言先验,导致模型频繁出现对可视文本指令的误判或忽略现象,即"OCR幻觉"问题。本报告致力于构建系统化的OCR幻觉缓解方案,提出专用评测基准和两套互补的幻觉抑制方法。在评测体系方面,构建了涵盖九类幻觉场景的HalluText基准和首个语义幻觉专用的TextHalu-Bench基准。在技术方案方面,提出了轻量级OCRAssistor方法,通过融合OCR模型对比解码实现性能提升;以及MLLM自适应幻觉消除框架,包含ZoomText文本定位和Grounded Layer Correction层融合机制。通过多个公开基准验证,所提方法显著改善了主流开源模型的OCR任务表现,为多模态大模型的可视文本感知能力提升提供了有效路径。
徐龙 教授
个人简介:徐龙,宁波大学信息科学与工程学院教授,中科院“百人计划”A类人才。2009年从中科院计算所获得工学博士学位,2009年至2014年先后在香港城市大学、香港中文大学和新加坡南洋理工大学留学,2014年入选中科院“百人计划”A类海外高层次引进人才,终期被评为“优秀”,2019-2022年担任中科院国家天文台太阳活动预报团组首席科学家,2022初-2023年底在中科院国家空间科学中心空间天气国家重点实验室。主要从事人工智能、空间天气及太阳活动预报建模方面的研究。近年来发表SCI/EI论文150余篇,其中以第一作者和通讯作者发表领域顶级期刊(TIP、TMM、TCSVT、PR、ApJS等)17篇,获得欧洲和美国专利授权5项。中国电子学会青年俱乐部会员、中国电子学会VR/AR技术与产业分会委员、人工智能学会“深度学习专委会”秘书长、人工智能学会第八届理事。
报告题目:基于因果注意力的深度学习太阳耀斑预测模型
报告摘要:现有深度学习耀斑预测模型多侧重数据相关性而非因果性,且面临数据集正负样本严重不平衡(耀斑样本远少于非耀斑样本)的问题,难以有效提取耀斑真实前兆特征。为此,我们提出了一种融合因果推断的深度学习模型CausalNet。该模型核心创新包括:1)引入因果注意力模块(CaaM),通过对抗优化分离输入磁图中的因果特征(耀斑前兆相关)与混杂特征(干扰因素),减少非物理关联的干扰;2)设计自适应数据集分割机制,将负样本划分为多个子集并与所有正样本组合形成平衡子集,训练中根据模型预测结果动态调整子集,同时避免数据泄露,缓解样本不平衡问题。
实验结果表明,CausalNet在测试集上表现优于AlexNet、SqueezeNet和ResNet18等基线模型:准确率(ACC)提升4.08%、真实技能评分(TSS)提升8.38%、AUC提升2.19%;通过梯度加权类激活映射(GradCAM)可视化发现,模型重点关注活动区极性反转线(PIL)区域,与太阳物理理论一致,且其热力图与PIL凸包的交并比(IoU)较ResNet18平均提升44.37%,验证了特征提取的有效性。此外,CausalNet计算复杂度较低,相比ResNet18参数减少3.67%、计算量减少7.14%,具备实时预测潜力。
该研究首次将因果注意力机制应用于太阳耀斑预测,实现了从相关性分析到因果推断的突破,为提升耀斑预测模型的鲁棒性和物理可解释性提供了新方法。
张成文 副教授
个人简介:张成文,北京邮电大学计算机学院,国重科研团队,擅长数智化研究、开发,中国人工智能学会高级会员,出版了DeepSeek实战、大模型导论,成立了两个大模型专委会:中国电子商会大模型应用产业专委会副理事长、中关村人才协会大模型人才专委会常务副主席。中国人工智能产业发展联盟产学研工作组副组长、中关村大数据产业联盟人才中心副主任、中国教育发展战略学会AI与机器人专委会理事、中国智能制造百人会专委。国家卫生健康委能力建设和继续教育超声医学专家委员会理工组组长、国家药品监督管理局智能化医疗器械监管科学创新研究基地学术委员会委员、IEEE TEMS-SMD智能眼科中国分部常委、中国医学装备协会AI和医用机器人工作委员会常委兼副秘书长、中国生物医学工程学会医学人工智能分会委员,北京数字健康研究会专家委员会副主委。组织了几十个头部企业编写了“AI在新冠肺炎诊疗及疫情防控中的应用报告”。
报告题目:从工具到伙伴:大模型智能体重塑高校教育生态的探索与思考
报告摘要:本报告聚焦大模型智能体从辅助工具向教育伙伴的角色演进,剖析其如何深度重塑高校教育生态。报告首先梳理大模型智能体在高校教学、科研、管理三大核心场景的应用实践,包括一些关键方向。进而探讨大模型智能体带来的教育范式变革,分析其在打破传统教学边界、激发学生自主学习能力、提升教育资源普惠性等方面的核心价值,同时直面技术伦理、数据安全、师生关系重构等现实挑战。最后,提出高校应用大模型智能体的实施路径与未来展望,旨在为高校教育生态的智能化升级提供兼具理论与实践指导意义的探索思路。
段立娟 教授
个人简介:段立娟,现任北京工业大学教授、博士生导师。计算机学会杰出会员、电子学会会员、密码学会会员、人工智能学会科普专委会委员,中国图象图形学学会视觉大数据专委会委员。主要研究领域为脑机接口、模式识别、机器学习等。参于973、863项目以及科技部重点研发计划各1项,主持及参与国家自然科学基金项目6项。入选北京市委组织部优秀人才培养计划、北京市属高等学校青年拔尖人才培育计划。2012年获得中国电子学会科学技术奖二等奖。2016年获得中国电子学会科技进步三等奖。2022年获得中国康复医学会科学技术三等奖。已在IEEE Transactions on Systems, Man, and Cybernetics: Systems、IEEE Transactions on Pattern Analysis and Machine Intelligence、IEEE Journal of Biomedical and Health Informatics、Neural Networks、Pattern Recognition等刊物和AAAI等重要会议发表学术论文100余篇。授权国内专利40项,授权国际专利5项。设计了一套基于脑机接口的睡眠障碍人工智能辅助诊疗产品,提出的基于联邦深度学习的大数据分析算法实现了对精准医疗的完全隐私保护。开发的脑机接口设备集脑电采集、睡眠数据采集、算法分析为一体,形成EEG、PSG、EEG+PSG一机多用的产品方案,既适用于睡眠监测和睡眠质量评估,也可用于日常神经科对于睡眠、抑郁症、老年痴呆等多种疾病辅助诊疗。该项技术在2023年第六届全国机器人专利创新创业大赛“基于脑机接口的抑郁及睡眠障碍人工智能辅助诊疗方法与设备”获得特等奖。
报告题目:基于人工智能的脑电接口技术
报告摘要:人工智能(AI)与脑机接口(BCI)的深度融合,正推动人机交互迈入 “意念互联” 新纪元,已成为神经工程与智能科技交叉领域的核心突破方向。传统 BCI 长期受困于信号解析精度低、个体适配性差等瓶颈制约,AI 技术则依托深度学习与自适应算法,为突破这些技术难点提供了关键解决方案。本报告聚焦基于人工智能的脑机接口应用,具体介绍癫痫检测与定位、抑郁症识别、睡眠自动分期等三个核心方向。
黄进 研究员
个人简介:黄进,中国科学院软件研究所研究员,剑桥大学公派访问学者,中科院青年创新促进会会员,中科院软件所杰出青年科技人才,中科院特聘骨干研究岗位获得者。2018年提出“三高斯”移动目标获取不确定性模型,建立了动态交互不确定性理论体系,在CHI、UIST、IJHCS、中国科学、软件学报等会议、期刊上发表论文 70 余篇,担任2020-2022 ACM CHI程序委员会委员,CHI、TOCHI、IJHCS、Ubicomp、IEEE VR、UIST等会议、期刊审稿人,主持国家自然科学基金、国家重点研发计划项目子课题、科技委项目多项,10 项国家发明专利获得授权,参与制定国家标准 2 项,多项技术与系统在教育、医疗、办公等领域得到应用。(个人主页:http://www.jin-huang.net/)
报告题目:人机增强智能与笔交互技术的教育应用
报告摘要:人机增强智能与笔交互技术正深刻重塑未来教育生态。前者将大模型和教师的能力结合,实现提供个性化教学内容生成,后者则通过自然、高效的笔式交互,提高教师教学和学生学习效率。本报告重点分享讲者团队在人机增强智能和笔交互技术方面的多项工作,包括人机增强智能计算平台构建、K12教学问题生成智能体、AI伴学智能体、数学公式识别、推荐与编辑技术、表格及内容识别等,旨在探讨基于人机增强智能与自然笔式交互的AI教育技术发展,为真正实现个性化教育与自然高效学习提供参考。
四、会议流程:
13:30-14:00 签到
14:00-14:05 主持人致开场词,介绍与会领导和专家
14:05-14:10:人工智能学院院长陈东义致辞
14:10-14:15:科技处致辞,张恒副处长
14:15-14:20:CSIG领导致辞,温正棋教授
14:20-14:50:周宇,南开大学,教授;
报告题目:多模态文档大模型幻觉问题及缓解方法研究
14:50-15:20:徐龙,宁波大学,教授;
报告题目:基于因果注意力的深度学习太阳耀斑预测模型
15:20-15:50:张成文,北京邮电大学,副教授;
报告题目:从工具到伙伴:大模型智能体重塑高校教育生态的探索与思考
15:50-16:20:段立娟,北京工业大学,教授;
报告题目:基于人工智能的脑电接口技术
16:20-16:50:黄进,中国科学院软件研究所,研究员;
报告题目:人机增强智能与笔交互技术的教育应用
17:00 合照
五、联系方式
承办方联系人:刘老师 13811456265 liujunfa@zut.edu.cn
主办方联系人:王老师 010-82544754 info@csig.org.cn
Copyright © 2025 中国图象图形学学会 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190