CSIG企业行—走进软牛科技将于11月12日举办

学会动态

CSIG企业行—走进软牛科技将于11月12日举办

发布时间：2025-11-06 来源：中国图象图形学学会分享：

为更好地服务领域内企业，促进产学研合作交流，中国图象图形学学会拟于2025年11月12日在深圳举办CSIG企业行—走进软牛科技，通过搭建学术界与企业交流合作平台，为企业创新发展提供科技支撑，并为图像图形领域高校师生提供与企业互动机会，集结产学研力量，共同推动图像图形领域的发展。

近年来，生成式人工智能（AIGC）在图像、语音、视频等多模态内容的生成与理解方面取得了突破性进展。随着模型规模的提升与算法范式的演进，AIGC 正从内容创作工具向智能生产力引擎转变，在媒体理解、虚拟交互、艺术创作等领域展现出广阔的应用潜力。同时，生成内容的安全性与可控性也成为学术界与产业界共同关注的焦点。

本次活动主题为 “AIGC时代的多模态内容：生成、理解与安全治理”，特邀请相关领域的专家学者与企业研发团队，共同探讨生成式人工智能的最新研究进展、关键技术挑战及产业化落地路径。

组织机构

主办单位：中国图象图形学学会（CSIG）

承办单位：CSIG数字媒体取证与安全专委会、深大-软牛人工智能技术联合创新中心

活动时间：2025年11月12日 14:30-17:30

活动地点：深圳市宝安中心区前海人寿金融中心T2栋25层-软牛科技集团股份有限公司

活动形式：参观走访、专家报告、座谈交流

执行主席：李昊东深圳大学助理教授、郑森圭软牛科技集团算法研发总监、李斌深圳大学教授

活动日程

14:30-14:50 软牛科技集团介绍

14:50-15:25 主题报告：生成式人工智能驱动的图像复原（任文琦教授）

15:25-16:00 主题报告：智能语音技术研究进展（武执政副教授）

16:00-16:35 主题报告：迈向复杂叙事的视频生成（寸晓东助理教授）

16:35-17:10 主题报告：AIGC内容安全的几个观点（黄继武教授）

17:10-17:30 讨论交流环节

特邀专家

黄继武深圳北理莫斯科大学首席教授

个人简介：黄继武，工学博士。深圳北理莫斯科大学首席教授、IEEE Fellow。广东省网络与信息安全产学研创新联盟理事长。获国家杰出青年科学基金。入选广东省特支计划杰出人才。分别毕业于西安电子科技大学（电子对抗专业，学士）、清华大学（通信与信息系统专业，硕士）、中国科学院自动化所（模式识别与智能系统专业，博士）。研究兴趣为多媒体取证与安全、信息隐藏。曾获国家自然科学二等奖（排名第二）、教育部自然科学一等奖（排名第一）、中国计算机学会自然科学一等奖（排名第一）、广东省教学成果一等奖（排名第一）。在本领域发表学术论文350多篇，Google学术引用24000多次，H-index 82。

报告题目：AIGC内容安全的几个观点

报告摘要：多媒体内容在给广大用户带来丰富体验的同时，其存在的安全隐患也由来已久，特别是以虚假媒体为代表的多媒体安全案例近年来呈现快速上升趋势。AIGC的出现和流行相应增加了内容安全隐患。围绕AIGC带来的安全问题引起了国家和社会的高度重视与关注。然而，有些安全问题似乎有扩大化之嫌，其在实际场景中的安全威胁没有人们想像的那么严重。一些面向AIGC的内容安全技术的重要性也似有需要重新评价的必要。本报告从安全威胁的角度，讨论了AIGC相比传统多媒体在安全领域带来的新问题。在此基础上，对一些目前AIGC安全热点技术的重要性和应用前景进行了讨论。

任文琦中山大学教授

个人简介：任文琦，教授、博导，中山大学“百人计划”引进人才，信息技术教育部重点实验室副主任，国家优青获得者，天津大学与美国加州大学Merced分校联合培养博士，从事图像处理、计算机视觉、人工智能安全领域的研究。在CCF-A类和中科院一区发表学术论文100余篇（8篇ESI高被引论文，2篇热点论文），谷歌学术引用22000余次，第一作者单篇最高被引2200余次，近三年连续入选爱思唯尔中国高被引学者，入选2024年ScholarGPS全球前0.05%顶尖科学家榜单。多次担任CVPR、ICCV、NeurIPS、ICLR、AAAI等AI和CV领域重要学术会议的领域主席，担任IEEE Transactions on Image Processing编委 (Associate Editor)、《中国图象图形学报》青年编委等。主持国家自然科学优秀青年基金、联合重点项目、面上、青年、国际合作和交流项目，深圳市优秀科技创新人才培养项目，及华为、腾讯、美团等多项企业合作项目。获中国计算机学会优博论文奖、吴文俊人工智能优秀青年奖、中国电子学会自然科学一等奖（第二完成人）、中国图象图形学学会自然科学一等奖（第三完成人）、中共中央办公厅科技进步一等奖（第四完成人）。研究成果支撑了2次公安部专项、应用部署于华为Mate40手机、腾讯云架构等。

报告题目：生成式人工智能驱动的图像复原

报告摘要：近年来，以扩散模型为代表的生成式人工智能快速发展，涌现出包括 Stable Diffusion、Flux 在内的一系列先进模型，为图像复原带来了全新的机遇。本报告聚焦于生成式人工智能驱动的图像复原研究，系统回顾该领域的最新进展并展望未来趋势。以图像超分辨为主线，系统性地梳理三个维度的前沿研究方向：精准的条件控制、高效的先验适配以及实用的模型压缩与加速。同时，也将延伸探讨生成式模型在其他图像复原任务及视频复原方向的研究进展，以期凝练出当前研究的核心挑战与未来机遇，为该领域的创新提供一些启发与思考。

武执政香港中文大学(深圳) 副教授

个人简介：武执政，博士，香港中文大学（深圳）副教授。入选国家级青年人才、深圳市跨模态认知计算重点实验室副主任，连续多次入选斯坦福大学“全球前2％顶尖科学家”，多次获得最佳论文奖，也曾获得华为火花奖。于南洋理工大学获得博士学位，曾在Meta（原Facebook）、苹果、爱丁堡大学、微软亚洲研究院等机构从事学术研究和技术领导工作。武教授发起了开源工作Merlin、Amphion、Emilia，被超过700家单位使用（包括OpenAI）。 Amphion多次进入GitHub趋势榜榜首、Emilia成为HuggingFace音频类最受欢迎数据集（Most Liked）。武教授发起了第一届语音鉴伪国际评测、第一届语音转换国际评测，组织了2019年语音合成国际评测（Blizzard Challenge 2019）。武教授现为人工智能语音领域权威期刊IEEE/ACM TASLP、SPL等语音领域权威期刊编委, 也是IEEE Spoken Language Technology Workshop 2024的大会主席。

报告题目：智能语音技术研究进展

报告摘要：让AI像人一样自然交流是很多科学家追求的目标。语音包含丰富的信息，不仅仅是内容，还有副语言和环境信息。副语言信息包含了情感、口音、年龄等，而环境信息表达了语音所发生的场景信息。随着研究的深入和技术的进步，口语理解系统不仅需要理解文字信息，还需要识别和处理语音中的副语言信息和环境信息，从而具有良好的共情能力，使其不仅能听得清、听得懂，还能听出“人情味”。该报告将分享人工智能如何能够像人一样有“眼力劲”，像人一样带情感地说话。该报告也将分享可扩展至多任务的语音基座模型研究进展。

寸晓东大湾区大学助理教授

个人简介：寸晓东，博士，大湾区大学信息科学技术学院助理教授、独立PI、博士生导师，长期深耕生成式人工智能、视频生成与编辑领域的基础研究。2021年于澳门大学计算机科学专业获得博士学位，2021年至2024年间担任腾讯Al Lab视觉计算中心高级研究员，2024年9月正式加入大湾区大学信息科学技术学院。其近五年谷歌学术引用量超9000次，累计发表高水平论文50余篇，其中以第一作者/共同第一作者/通讯作者身份发表20余篇。多项研究成果被国内外媒体广泛报道，形成高影响力学术产出：包括视频生成模型VideoCrafter、MOFA-Video，视频编辑方法FateZero、Follow-Your-Pose，以及说话人视频生成系统 SadTalker、VideoReTalking等。上述主导项目在GitHub平台累计获得超3万次星标。主持国家自然科学基金青年项目(C类)和广东省粤莞联合基金(青年项目)。

报告题目：迈向复杂叙事的视频生成

报告摘要：故事性是驱动视频内容破圈传播、深度吸引用户的核心内核，生动的情节叙事能让视频在信息洪流中快速抓住注意力、传递情感价值。当前主流视频生成模型多以单一文本指令为核心驱动，聚焦于画面元素的还原与呈现，却难以突破 “无情节、弱逻辑” 的局限，无法支撑长时视频中连贯、多层级的复杂故事情节铺陈。本次报告将立足视频生成技术的演进逻辑，从基础原理与发展脉络切入，深入拆解现有视频扩散模型的技术框架，重点分享如何通过无需训练的技术优化与逻辑重构，实现复杂文本指令到完整情节视频的高效转化，以及通过定制化的方法，得到高质量的角色风格一致性，为长时、强叙事性视频的生成提供切实可行的技术思路与实践方向。

执行主席简介

李昊东，工学博士，深圳大学助理教授，硕士生导师，深圳市高层次人才，CSIG数字媒体取证与安全专业委员会委员。研究兴趣包括多媒体取证与安全、智能信息处理、机器学习等。在IEEE TIFS、IEEE TCSVT、ICCV等国际权威期刊/学术会议发表论文30余篇，谷歌学术引用2000多次，H指数19，9篇论文单篇被引100次以上。主持国家自然科学基金项目2项、广东省自然科学基金项目2项，参与NSFC联合基金重点项目1项、广东省重点领域研发计划项目1项。获中国发明专利授权6项，转化专利1项，参与制定技术标准1件。担任IEEE TPAMI、IEEE TIP、IEEE TIFS、IEEE TCSVT 等国际权威学术期刊的审稿人。获中国图象图形学学会自然科学二等奖（第三完成人）、欧洲信号处理学会（EURASIP）最佳论文奖、广东省计算机学会优秀论文一等奖。

郑森圭，博士，软牛科技算法研发总监。本科毕业于中山大学，博士毕业于中国科学院数学与系统科学研究院。曾任职于三星北京研究院、思谋科技。2019 年起深耕图像视频修复增强领域，主导研发的反交错、噪声抑制、压缩失真修复、动态插帧及超分辨率重建等核心模型，已应用于安防监控影视后期、移动端影像等多场景；曾负责翡翠台《天龙八部》、《寻秦记》等经典电视剧高清重制方案设计以及经典粤剧电影《牡丹亭惊梦》的4K超高清重制，并在香港成功上映；具备从算法创新到规模化商用的全链路攻坚能力，推动AI视觉增强技术从实验室走向产业级落地。

李斌，工学博士，深圳大学教授，博士生导师，广东省自然科学基金杰出青年基金获得者，深圳市高层次专业人才，深圳市优秀教师，IEEE/CCF/CSIG高级会员，深圳大学新锐研究生导师，入选全球前2%顶尖科学家榜单。担任广东省智能信息处理重点实验室主任、深圳市媒体信息内容安全重点实验室主任、CSIG数字媒体取证与安全专委会副主任、广东省图象图形学会副理事长、IEEE T-IFS资深领域编委。研究兴趣包括人工智能、多媒体处理、信息安全等。发表包括国际权威刊物IEEE T-IFS、IEEE T-IP、IEEE T-CSVT等SCI/EI论文150多篇，编著教材2部，谷歌学术引用8000多次，H指数39。获国家发明专利授权10余项，美国专利授权2项，转化专利1项，软件著作权8项，参与制定技术标准2件。主持国家自然科学基金联合基金重点项目、深圳市基础研究重点项目等科研项目。获中国计算机学会科学技术奖自然科学一等奖、中国图象图形学学会自然科学二等奖、深圳市自然科学二等奖、广东省人工智能产业协会自然科学一等奖。