欢迎光临中国图象图形学学会官方网站,让我们一起努力,探索图象图形领域的广袤天地!
首页 > 学会动态 > 学会新闻

第一期中国图象图形学学会文档图像学术微沙龙成功在线举办

2021-09-06

中国图象图形学学会(CSIG)文档图像分析与识别专业委员会学术微沙龙(简称:文档图像微沙龙)第一期活动于202191日成功举行。文档图像微沙龙由中国图象图形学学会主办,文档图像分析与识别专委会承办,中国图象图形学报协办。微沙龙首期活动邀请中国科学院自动化研究所博士研究生吴金文作为报告嘉宾,介绍了他在手写数学公式识别方面的研究进展。本次活动在B站、中国图象图形学报视频号进行了同步直播,人气峰值达到3000以上。

2.png中国科学院自动化研究所刘成林研究员致开幕辞

文档图像微沙龙首期活动由西南大学陈善雄副教授主持,中国科学院自动化研究所研究员、博士生导师刘成林老师致开幕辞。刘老师在致辞中指出,文档图像分析与识别研究是一个非常重要的领域,在图书电子化、金融票据识别、手机拍照文档识别等方面具有广泛的应用。近年来,得益于深度学习技术的发展,文档识别领域的技术在版面分析、文字的提取与识别、图形符号的识别等任务上性能提升显著,并在应用中取得了突破。但是,目前的技术对于复杂文档的版面处理、书写潦草的文字的适应能力还有所不足,未来的研究可以在深度和广度两个维度展开。在研究的深度方面,进一步提高复杂文档分析、书写变形文字识别的精度,同时提高算法的可靠性和可解释性;在研究的广度方面,扩展对不同类型、不同版式、多语言文档的支持,以及对文档中的公式、表格、图形符号和签名等多种元素的支持。刘老师表示,文档图像分析与识别专委会已开展多种学术交流活动,包括研讨会、公众号推送等,最新推出的文档图像微沙龙是一种很好的学术交流形式。

文档图像微沙龙协办单位《中国图象图形学报》韩向娣编辑介绍了包括“图图Seminar”公益学术直播在内的“图图”融媒体平台和学术服务。文档图像微沙龙首期活动也是“图图Seminar”第40期活动。

3.jpg    来自中国科学院自动化研究所的博士研究生吴金文做了题为“基于图的手写数学公式识别”的学术报告。报告首先介绍了手写数学公式的结构特点及技术挑战,回顾了手写数学公式识别的相关研究工作,包括基于语法规则的方法和基于图像到序列生成的方法。报告重点介绍了图到图生成的手写数学公式识别研究工作。该项工作已发表在AAAI 2021国际会议上,研究动机是将手写数学公式符号作为基元的显式表示,把输入的视觉图转换为符号关系图。具体方法流程为,使用图注意网络(Graph Attention Network, GAT)建模源图笔画间的空间以及时间关系,再使用图卷积网络(Graph Convolutional Network, GCN)学习目标符号标签图,并进一步推理符号间的语义层次关系。所提出的方法显著地提升了在多个公开联机手写数学公式数据集上的识别精度,并且显式分割出了公式中的数学符号。

报告嘉宾吴博士还回答了听众提出的一系列问题,包括公式符号的检测、联机手写笔画时序、连笔的处理等。

首期文档图像微沙龙活动取得了良好效果,我们期待更多的优秀青年学子在文档图像领域取得新的研究进展,并在后续的文档图像微沙龙活动中踊跃参与、携手共进!