欢迎光临中国图象图形学学会官方网站,让我们一起努力,探索图象图形领域的广袤天地!
首页 > 奖励与鉴定 > CSIG奖励访谈

2021年度CSIG优秀博士学位论文奖获奖者刘禹良

2022-04-25

中国图象图形学学会优秀博士学位论文奖旨在推动中国图像图形学领域的科技进步,鼓励创新性研究,促进青年人才成长。

为宣传科技工作者积极进取的工作精神,聚焦获奖人背后的故事,学会近日对荣获2021年度CSIG优秀博士学位论文奖的获奖者刘禹良进行了专访,以对话的形式,为读者们提供一次了解他的机会。

下面就跟着我们的脚步,走近今天的受访者吧。

111.jpg


问题一:首先非常感谢您接受我们的采访,请先向大家介绍一下自己:


       大家好,我是刘禹良,华南理工大学(广州)本科(2012.9-2016.6),华南理工大学博士(2016.9-2020.8),师从金连文教授,澳大利亚阿德莱德大学访问博士生(2019.3-2020.5)与博士后(2020.5-2020.11),合作导师沈春华教授,香港中文大学博士后(2021.1-2022.1),合作导师林达华教授,2022年3月起任华中科技大学人工智能与自动化学院研究员。本人曾在知名学术会议和期刊发表或录用论文30余篇,过去5年以一作在TPAMI,IJCV,TIP,CVPR等国际顶刊顶会发表论文10篇,共同一作5篇,通讯作者一篇。担任中国图象图形学报专题编委会编委,国家自然科学基金重点项目,国家重点研发计划主要研发成员,曾获CSIG优秀博士学位论文奖;曾获CVPR满分评审论文;曾3次受邀CCF A类国际顶会口头演讲;曾获ICDAR Robust Reading Challenge等6次国际竞赛冠军1次金奖(第六届互联网+)四次担任团队第一成员;受邀担任TPAMI,CVPR等多个顶级会议与期刊的资深程序委员会委员及审稿人,积极服务开源社区,开源项目10余项。创建多个国际知名数据集及合作举办多项国际竞赛如SCUT-CTW1500, ICPR2018-MTWI, ICDAR2019-ArT,  ICDAR2019-LSVT, ICDAR2021-ICT, 和ICPR2022-MSR。


问题二:下面请为大家简单的介绍一下您这篇论文的情况:


       本人作为第一作者通过提出自适应贝塞尔曲线网络v2 (ABCNet v2) 来解决端到端文本识别问题。主要贡献有四个方面:1) 首次利用参数化的Bezier曲线自适应拟合任意形状的文本,不仅可以提供结构化的输出,还可以提供可控的表示。2) 设计了一种新的BezierAlign层,用于提取任意形状文本实例的精确卷积特征,显著提高了卷积精度对以前方法的认识。3) 不同于以往的方法,往往后处理复杂,而且ABCNet v2保持了一个简单的框架,后处理只有非最大值抑制  (NMS)。4)由于文本识别的性能与特征对齐密切相关,ABCNet v2进一步采用了简单有效的坐标卷积对卷积滤波器的位置进行编码,从而可以以较小的计算开销带来较大的改进。在各种双语(英语和汉语)基准数据集上进行的综合实验表明,ABCNet v2能够在保持非常高的效率的同时实现最先进的性能。更重要的是,由于文本识别模型的量化研究较少,我们将模型量化以提高推理时间。


222.jpg


问题三:请问您在科研过程中,有没有什么好的方法可以推荐给大家?


1) 往往有时候毫无保留地先把一个工作做好反而可以更加高效。一次并行做太多工作,或者明明一个工作更好却拆成多个文章来发反而适得其反。

2) 顶层设计花的时间够多,后面就能少走很多弯路。有时候有一些想法开始没有想清楚直接去做,到头来验证成功了却发现只是基于现有SOTA框架上的一个incremental的工作,并没有太多创新去支撑一篇文章,这样会浪费很多时间。

3) 永远保持open mind,对一切都保留可能性,多跟不同领域的人讨论有时候可能可以得到意想不到的启发。

4) 再忙也要坚持读新论文。计算机视觉发展日新月异,紧跟前沿研究有时候可以避免做重复的工作或者节省很多时间。


问题四:在您论文筹备过程中遇到的最大的挑战是什么?是怎样克服的呢?


       最大的挑战莫过于想了很久的IDEA,实现了很久却发现不如预期。通过与前辈老师、同学和同领域的专家们进行讨论,错误样本分析,模型调整等,每一步都能带来一点点的改进,自己在克服困难的过程就像在不断地优化自己的实现方案来去逼近预期的结果。最后虽然证明原始的idea是不好的,但是也因此得到了新的能够成功的idea。在这个过程耐心很重要,不管是失败还是成功的试验,没有一步是浪费的。


问题五:最后,有什么话想对自己的导师说呢?


       我的恩师是金连文教授,我的为人处世,我的原则,我的研究风格,我的眼界,我的学习习惯,很多都是从刚进实验室我从一张白纸在金老师的教诲下慢慢塑造乃至成长到今天。金老师对学生要求很严格,但是这是建立在对自己更加严格的基础上的, CVPR rebuttal每年都在春节期间,我的第一篇CVPR文章就是金老师在春节期间一字一句的指导下才最终力挽狂澜扳回来的。在他身上我能看到一名学者对科研的严谨和纯粹,金老师告诉我,有些事要么就不做,要做就要尽力做到最好。金老师告诉我,要做顶天(能发表)立地(能落地)的工作,而实验室的风格也是一直如此践行,从过去的搜狗输入法到scut-gpen,到后面手写签名验证,再到教育OCR,大多都是围绕着真实应用场景出发的。金老师说每天要读一篇论文,这让我切身体会到了从量变到质变的过程,过去的坚持读好的论文是我能有一些新idea的源泉。金老师也曾教导我,诗境何人到,禅心又过诗,让我在这个节奏飞快人才辈出的时代,努力保持一份初心。饮水者怀其源,唯有将自己从做人再到做事变得更加优秀才不足以枉费金老师的悉心栽培。