登录会员系统  |  联系我们  |  加入学会  
学会动态
第五届文档图像分析与识别前沿理论与应用研讨会暨中国图象图形学学会文档图像分析与识别专委会2021学术年会成功召开
发布时间:2021-12-06      来源:中国图象图形学学会      分享:

    12月4日下午,由中国图象图形学学会主办,文档图像分析与识别专委会承办的“第五届CSIG文档图像分析与识别前沿理论与应用研讨会暨中国图象图形学学会文档图像分析与识别专委会2021年学术年会”以线上形式成功召开。

1.jpg图 1 会议以线上形式召开

    本次大会针对文档图像分析与识别基础理论与技术、NLP与文档处理、OCR前沿方向、热点问题和重大应用,特邀专家做学术报告,为本领域研究者和工程师提供一个良好的交流与合作平台。此次大会采用腾讯会议研讨和Bilibili网络直播两种方式同步进行。CSIG文档图像分析与识别专委会80多名委员、19名候选委员通过腾讯会议参加了本次研讨会,网络直播人气峰值近4000 

2.png

图 2 会议日程一览表

    本次大会分两个部分进行了学术报告,分别由专委会主任华南理工大学金连文教授和专委会副主任华东师范大学吕岳教授主持。会议开始,金连文教授进行了致辞。会议邀请哈尔滨工业大学车万翔教授、南京大学路通教授、中国科学技术大学谢洪涛教授、以及复旦大学魏忠钰副教授分别作了精彩报告。

3.png图 3 车万翔教授作报告

    来自哈尔滨工业大学的车万翔教授作了题为“大规模预训练模型—从自然语言处理说起”的学术报告。大规模预训练模型最早发端于自然语言处理领域,随着以GPT、BERT为代表的大规模预训练模型的兴起,自然语言处理研究取得了突飞猛进的发展,进而影响到整个人工智能的研究和应用,标志着“大规模预训练模型”时代的开启。人工智能、尤其是机器学习的发展历史呈现了一种明显的“同质化”趋势。大规模预训练模型同质化的特征更加明显,几乎所有最新的自然语言处理模型现在都源自少数大规模预训练模型。同质化还体现在跨数据类型上,基于Transformer的序列建模方法以及大规模预训练模型在被成功应用于自然语言后,现已在图像、视频、语音、表格数据、蛋白质序列、有机分子等数据上取得了优异的效果。车万翔教授首先回顾了大规模预训练模型在自然语言处理领域的演化历史,接着介绍了他们团队目前在多模态领域的最新工作,最后探讨了人工智能的一些未来发展趋势。

4.png图 4 路通教授作报告

    南京大学路通教授带来的学术报告主题是“以文字为中心的媒体内容理解研究进展“。近年来,随着以图像、视频、音频等为主要载体的各类互联网应用的快速发展,人们对获取海量媒体数据中蕴含的内容信息的需求愈加迫切。文字作为最为简洁、抽象和直接的语义表示方式,在媒体内容理解研究中发挥了关键作用。路通教授介绍了以文字为中心的内容理解研究中的问题、方法、技术路线和近期进展,并给出了其相关的应用场景。

5.png图 5 谢洪涛教授作报告

    来自中国科学技术大学的谢洪涛教授作了题为“场景文字识别中的语言模型联合优化方法” 学术报告,近年来,语言模型在场景文字识别任务中取得了广泛的进展。然而,如何实现鲁棒及高效的语言建模仍需要进一步地探索。此外,语言模型收敛速度慢的问题增加了识别器的训练难度。谢洪涛教授从三个方面讲述了场景文字识别中语言模型联合优化的方法:双向语言建模的语言模型、基于预训练快速收敛的语言模型、视觉与语言模型的融合。通过探索语言模型从网络结构、优化策略、建模方式等方面进行联合优化,实现充分利用语言规则提升场景文字识别算法性能的目的。同时,谢洪涛教授对如何进一步提升语言模型性能、未来语言模型的趋势等进行了展望。

6.png图 6 魏忠钰副教授作报告

    最后,复旦大学魏忠钰副教授带来了题为“跨视觉语言模态的语义建模”学术报告。跨视觉和语言模态的语义理解和生成是结合计算机视觉和自然语言处理的一个重要课题,有广阔的应用需求,包括图片检索,实力障碍人士的辅助工具以及低龄学童教育支持等。视觉和语言是我们感知外部环境的重要方式,某种程度上说,它们是同一个客观世界的两套表示方法,并且互有侧重。近年来,深度学习的发展为跨视觉和语言领域的研究提供了便利,也催生了很多跨模态任务。魏忠钰副教授针对结合视觉和语言模态联合语义的建模方法展开,介绍了他们团队在语义空间构建方面的一些工作,以及在文本生成和跨模态语义匹配方面的应用。

    在报告过程中,与会的专委会委员们和线上观看直播的网友积极参与了交流与互动,提问及讨论环节气氛热烈。不少听众纷纷表示希望能提供此次研讨会的回播服务,并希望或获取报告专家的演讲PPT进行进一步学习。网络直播人气峰值最高时达到近4000。

Copyright © 2025 中国图象图形学学会 京公网安备 11010802035643号   京ICP备12009057号-1

地址:北京市海淀区中关村东路95号 邮编:100190

技术支持:中科服