中国图象图形学学会第十三期学生会员分享论坛将于11月30日举办

学会动态

中国图象图形学学会第十三期学生会员分享论坛将于11月30日举办

发布时间：2024-11-21 来源：中国图象图形学学会分享：

为促进学术交流、开拓学术视野、激发创新思维，助力图像图形领域研究生学术成长和未来职业发展，中国图象图形学学会（CSIG）创办CSIG学生会员分享论坛，论坛以研究生自主开展学术交流为主，同时，积极发挥导师的指导作用，帮助研究生开阔视野，启迪智慧，提高创新能力。CSIG第十三期学生会员分享论坛将于2024年11月30日举办，邀请到了KAUST博士生诸葛鸣晨、北京大学博士生倪星宇、复旦大学博士生余海洋、同济大学博士后岳子杰作精彩学术报告，并邀请浙江大学李玺教授、浙江大学彭思达研究员、华南理工大学金连文教授、天津大学刘婧副教授担任评议嘉宾对研究工作作出点评并解惑，活动由浙江大学王伽臣研究员主持，共同围绕研究生学术生涯的热点话题进行探讨。

主办单位

中国图象图形学学会（CSIG）

承办单位

CSIG优博俱乐部

CSIG会员发展与服务工作委员会

会议时间

2024年11月30日（星期六）19:00-21:35

会议地点

线上地址1（腾讯会议）：790-696-436

图片1.jpg

线上地址2（CSIG视频号直播）：

欢迎关注CSIG官方视频号，观看直播

CSIG视频号二维码.jpg

线上地址3（寇享学术直播）：

会议议程

特邀评议嘉宾

李玺教授，浙江大学

个人简介：李玺，浙江大学求是特聘教授，国家杰青，IAPR Fellow，IET Fellow，IEEE Senior Member，CCF杰出会员，全球前2%顶尖科学家，Elsevier 2023“中国高被引学者”，国家青年特聘专家。从事人工智能和计算机视觉等领域的研究，发表高水平学术论文200余篇，以第一完成人获得两项省部级科技奖励一等奖，华为优秀合作技术成果奖和华为火花价值奖。荣获四项最佳学术论文奖。成果应用于华为、阿里、海康等企业。

彭思达研究员，浙江大学

个人简介：彭思达，浙江大学软件学院“百人计划”研究员，博士生导师。研究方向为三维计算机视觉和计算机图形学。至今在TPAMI、CVPR、ICCV等期刊或会议发表五十余篇论文，谷歌学术引用4300余次，其中一篇一作论文获得CVPR最佳论文提名，成果获得GitHub上万次stars和2024年中国CCF图形开源软件奖。入选斯坦福2024全球Top 2%科学家榜单、2023年世界人工智能大会云帆奖-明日之星、浙江省优博。被苹果公司评为2022 Apple Scholar（亚太地区唯一），被华为公司评为2024启真优秀青年学者。

金连文教授，华南理工大学

个人简介：金连文，男，华南理工大学二级教授，兼任中国图象图形学学会（CSIG）常务理事、CSIG文档图像分析与识别专委会主任、广东省图象图形学会理事长、广东省高校音视频图文智能信息处理工程研究中心主任等职。主要研究领域为文字识别、文档图像理解、计算机视觉、人工智能与多模态大模型等，在重要学术期刊及国际会议上发表论文200余篇（其中SCI一区+CCF A类论文100余篇），Google Scholar论文被引用数16000余次，H-Index 65。近5年连续入选“斯坦福大学全球前2％顶尖科学家”榜单。2006年入选教育部“新世纪优秀人才”计划。获省部级科技奖5项（其中一等奖2项，二等奖3项）；荣获CAAI、CIE、CSIG等全国学会科技进步二等奖3项；指导学生参加CVPR、ICDAR、ICPR、PRCV等国际国内知名会议上的学术竞赛并荣获冠军20余次。

刘婧 副教授，天津大学

个人简介：刘婧，天津大学电气自动化与信息工程学院，副教授，天津大学北洋学者青年骨干教师。主要研究方向为多媒体处理和内容理解，曾获得中国图象图形学学会优秀博士学位论文提名奖，天津市科学技术进步特等奖，先后主持国家自然科学基金面上项目及青年项目、中国博士后科学基金特别资助、天津市自然科学基金等项目。发表70余篇期刊及会议论文，谷歌学术引用2000余次，获2021年度IEEE Transactions on Multimedia最佳论文提名奖、2022 年国际数字多媒体通信论坛最佳墙报论文奖等。

报告嘉宾

诸葛鸣晨博士研究生

报告题目：智能体进化之路

报告摘要：汇报将探讨未来智能体社会的构建路径，涵盖基础理论、技术进展与实践方向。从自然语言心智社会模型（NLSOM）出发，回顾了基于大语言模型的智能体社会的早期探索与发展轨迹。重点介绍了GPTSwarm——一个基于图的可优化智能体蜂群系统，为自主智能体社会的构建提供了新的构建视角。此外，演讲引入了Agent-as-a-Judge框架，使智能体能够评估其他智能体系统，从而在复杂任务中实现过程性反馈，并提供关键的奖励信号以增强自我改进能力。同时，也将介绍了MetaGPT（多智能体元编程框架）与OpenHands（单智能体开源最佳实践）等前沿项目。

个人简介：诸葛鸣晨，沙特阿卜杜拉国王科技大学（KAUST）的计算机科学博士生，师从被誉为“LSTM之父”和“现代人工智能之父”的Jürgen Schmidhuber教授。研究领域集中于大语言模型和多模态智能体。目前，他在Meta AI实习，博士就读前，曾在微软、阿联酋起源人工智能研究院和阿里巴巴等知名机构任职。他以第一作者身份在ICML、ICLR、CVPR、TPAMI等顶级会议和期刊上发表了多篇论文，荣获NeurIPS最佳论文奖和CVPR杰出审稿人等奖项，论文累计被引用近1100次。他还积极参与了包括GPTSwarm、MetaGPT、OpenDevin和Agent-as-a-Judge在内的多个开源项目，这些项目在GitHub上累计获得超过70,000次Stars。

倪星宇博士研究生

报告题目：兼容深度学习的物理场景表达

报告摘要：物理场景的生成和理解是密不可分的两项任务。一方面，图形生成方法为物理场景理解提供了数学模型与数值工具；另一方面，视觉感知技术为物理场景生成赋予了参数智能推断、性能自动调优等多种可能。当前，面向三维动态物理场景的重建、交互与预测的前沿算法，尚存在无法忽略的问题：建立在空间正交网格和模型四面体网格等表达上的经典物理模拟方案与深度学习应用的输入、输出不完全匹配，数据在二者间的转换和规约不可避免地引入系统性误差和额外的计算代价。因此，有必要对前沿的物理动画生成技术加以检视，以与深度学习相兼容的几何表达为媒介，重新构建生成与理解无缝衔接的物理场景处理管线。

个人简介：倪星宇，北京大学2020级直博研究生，师从陈宝权教授，研究方向为计算机图形学，尤其是基于物理的模拟与渲染等。在SIGGRAPH、SIGGRAPH Asia等图形学顶级会议上发表论文七篇，其中第一作者/共同第一作者五篇，收录于ACM Transactions on Graphics、Computer-Aided Design等期刊中。本科毕业于北京大学第一届“图灵班”，获计算机科学与物理学双学士学位。首届字节跳动奖学金、第二届凌迪科技图形学奖学金得主。GAMES001课程主讲人。

余海洋博士研究生

报告题目： 零样本场景下的中文字符/文本识别

报告摘要：场景文本识别具有十分广泛的应用前景，如街景招牌文本识别、票据图片关键信息提取、视频图像字幕识别等。然而，中文场景文本识别存在一些特定难题，例如零样本字符和竖直排列文本的识别问题等。本报告首先介绍中文字符的多种先验信息，接着回顾已有方法的发展历程并介绍相关代表性方法，然后介绍针对中文场景下的开放集字符识别或文本识别任务的方法。在开放集字符识别任务中，已有方法较多集中于基于整字或部首的识别，我们提出了两种用于解决字符零样本问题的识别方法，一是在细粒度的笔画层级上拆解中文字符，并借助笔画先验信息的序列匹配方法识别零样本字符，二是基于多层级信息的中文字符识别方法，利用中文字符的多重先验信息增强匹配精度。在文本行识别任务中，针对竖直中文样本，我们提出了一种基于方向信息解耦的中文文本识别方法；此外，为了解决文本行中零样本字符问题，我们提出了一种基于部首序列-图像对齐的中文文本识别方法。具体的，该方法首先利用CLIP框架学习中文字符标准表示，而后用其监督文本识别过程。本报告最后将介绍我们提出的中文文本识别评测基准与相关数据集。

个人简介：余海洋，复旦大学博士在读。研究工作主要围绕场景（视频）文本识别、文本分割、视频多目标追踪等计算机视觉方向；发表CCF-A/B类论文13篇、中文核心期刊2篇。目前研究方向主要围绕基于文本理解的多模态文档/视频处理任务。

岳子杰博士后

报告题目：基于自监督学习的非接触式生命体征检测方法

报告摘要：心率、呼吸率等生命体征检测是健康评估、疾病诊断、病情监控等医疗健康管理过程中的首要环节与重要基础。近年来基于面部视频的非接触式生命体征检测方法已成为前沿研究热点，然而现有基于监督式学习的技术体系需要收集大量视频-信号样本对完成模型训练，此类带标注数据的收集非常耗时耗力，收集过程繁琐且受试者体验极差，严重限制了数据规模，导致现有算法难以在新场景中快速部署且普遍存在欠拟合问题。为此，本次报告将介绍我们提出的基于自监督学习的非接触式生命体征检测方法，包括面向频率的自监督学习新型框架、面向频率的视频-文本对构建方法及相应的视觉语言大模型编码器微调技术、频率对比优化函数组等。该方法有效解决对有标签数据的依赖问题，实现精准的心率、呼吸率检测。

个人简介：岳子杰，同济大学控制科学与工程流动站博士后，已发表期刊会议论文16篇，其中SCI一区TOP期刊及CCF A类会议8篇，第一作者论文7篇，发表于TPAMI、CVPR、TKDE等，授权国家发明专利13项，主持国家自然科学基金青年项目与中国博士后科学基金面上项目，入选上海市“超级博士后”激励计划。

主持人

王伽臣研究员，浙江大学

个人简介：王伽臣，浙江大学教育学院体育系百人计划研究员，博士生导师。获得浙江大学数字媒体技术学士学位与浙江大学计算机科学与技术博士学位，曾任香港科技大学计算机科学与工程系博士后研究员。主要研究方向为面向体育数据的可视分析、知识挖掘、机器学习和人机交互技术。在IEEE VIS、IEEE TVCG、ACM SIGKDD、ACM SIGCHI等计算机领域顶级会议和期刊发表论文14篇，其中7篇为一作论文，获得授权发明专利8项，曾获得2023年度CSIG优秀博士学位论文与浙江省优秀博士学位论文。担任IEEE与ACM旗下多个计算机领域顶级会议和期刊的审稿人。