欢迎光临中国图象图形学学会官方网站,让我们一起努力,探索图象图形领域的广袤天地!
首页 > 学会动态 > 活动预告

CSIG交通视频专委会走进中国民航大学将于12月30日举行

2022-12-29

一、会议信息

主办单位:中国图象图形学学会(CSIG)

承办单位:CSIG交通视频专委会、中国民航大学、民航智慧机场理论与系统重点实验室

会议时间:2022年12月30日 星期五 09:00-12:00

直播地址:腾讯会议(会议号:620-345-910)


二、会议安排

截屏2022-12-29 上午9.12.36.png


三、报告人简介

图片155.png

王井东

百度计算机视觉首席科学家


研究方向:计算机视觉、深度学习、多媒体搜索

报告题目:《百度文心·CV大模型在智能交通中的应用》

报告摘要:

      本报告介绍百度文心·CV大模型在智能交通中的应用。首先,介绍自监督表征预训练算法Context Autoencoder,其特点是在表征空间中完成图像掩码预测任务,可以学到高语义信息的表征,效果超越BEiT和MAE。然后,介绍基于transformer的目标检测算法(Group DETR),基于这一方法,我们在COCO目标检测测评中首次达到64.5 mAP的效果。最后,介绍视觉大模型在自动驾驶感知的应用,包括多模态感知和数据挖掘。

报告人简介:

      王井东,百度计算机视觉首席科学家,负责计算机视觉领域的研究、技术创新和产品研发。加入百度之前,曾任微软亚洲研究院视觉计算组首席研究员。研究领域为计算机视觉、深度学习及多媒体搜索。他的代表工作包括高分辨率神经网络(HRNet)、基于有监督的区域特征融合(DRFI)的显著目标检测、以及基于近邻图的大规模最近邻搜索(NGS,SPTAG)等。他曾担任过许多人工智能会议的领域主席,如 CVPR、ICCV、ECCV、AAAI、IJCAI、ACM MM等。他现在是IEEE TPAMI和IJCV的编委会成员,曾是IEEE TMM和IEEE TCSVT编委会成员。因在视觉内容理解和检索领域的杰出贡献,他被遴选为国际电气电子工程师学会和国际模式识别学会会士 (IEEE/IAPR Fellow)、国际计算机协会杰出会员。


图片156.png

王耀威

 深圳鹏城实验室研究员

视觉智能研究所所长、IEEE DCSC数字视网膜系统工作组主席


研究方向:计算机视觉、深度学习

报告题目:《视觉预训练大模型:城市级交通视频智能处理的新动力》

报告摘要:

 近年来,国家社会经济的高速发展催生交通智能化的重大需求,多种类型的摄像头得到快速部署,汇聚形成具有时空尺度的海量视频图像数据亟待处理,大规模视频智能感知处理问题成为各中大型城市交通智能化发展面临的重大挑战。鹏城实验室团队融合CNNTransformerconformer基网架构,成功训练鹏程·大圣视觉模型,提供了一种强泛化性视觉表征的新范式;同时开发了部署框架,支持模型快速自适应迁移、压缩与适配功能。目前,该模型已在交通领域的多类场景任务中部署,突破了城市级交通视频实时“感知”、“智能”处理的瓶颈问题,提升城市交通运行效率,将推动交通行业的智能化升级。

报告人简介:

      王耀威,2005年获中国科学院大学计算机科学博士学位,现任深圳鹏城实验室研究员,视觉智能研究所所长。IEEE DCSC数字视网膜系统工作组主席,IEEE、CIE、CCF、CSIG 会员。在多媒体领域开展研究工作20余年,授权50多项专利,在IEEE TIP、CVPR、ICCV等国际期刊和会议上发表论文120余篇。曾获2015年中国电子学会技术发明一等奖和2017年国家技术发明二等奖。作为项目负责人和联合负责人承担鹏城实验室重大攻关任务2项,曾主持国家自然科学基金面上项目2项,作为课题负责人参与国家级、省部级重要项目及企业合作科研项目20余项。构建了以“视频流、特征流、模型流”三流协同为主要特征的“数字视网膜”城市感知网络;发明并训练10亿参数“鹏程·大圣”视觉基础模型,性能处于国际先进水平的前列;带领团队研发基于自主可控国产芯片的软硬件系统,荣获2022世界物联网博览会金奖。推动数字视网膜系统的标准制定,相关技术成果已推广应用于多个大中城市,获显著经济社会效益。


1672280156468941.png

韩亚洪

天津大学智能与计算学部教授、博士生导师


研究方向:多媒体分析、计算机视觉、人工智能安全

报告题目:《视觉模型域自适应与跨任务大模型蒸馏》

报告摘要:

      智慧城市和智能交通的应用场景在人群密度、建筑环境、光照条件等方面呈现多样化特性,尽管视觉大模型通过海量参数和训练数据进行优化可拥有良好泛化性,但运行这样的模型无论在云端或终端设备都面临巨大运算压力。现有方法使用固定模型去处理各种场景,并通过增加模型容量和训练数据等手段提升性能,不可避免地加大了训练/推理成本,且不够灵活。本报告首先介绍面向交通场景的域自适应目标检测研究,并汇报鹏城实验室“面向智慧城市的目标检测算法基准测试”建设;在此基础上介绍面向视觉大模型赋能应用的跨任务大模型蒸馏方法,我们提出通过原型学习大模型的泛化知识并引导将大模型知识跨任务蒸馏至多种类型下游任务中,并在智能交通场景进行了验证;报告最后对泛视觉场景的大模型自适应学习框架进行展望。

报告人简介:

      韩亚洪,天津大学智能与计算学部教授、博士生导师,研究方向为多媒体分析、计算机视觉和人工智能安全;2012年3月博士毕业于浙江大学计算机学院,博士毕业被天津大学直接聘为副教授,2016年在天津大学破格晋升正教授,2021年被聘为天津大学“英才教授”;曾获得中国计算机学会(CCF)优秀博士学位论文奖,入选教育部新世纪优秀人才支持计划,加州大学伯克利统计系访问学者(2014-2015年);获得ACM Multimedia 2017“最佳论文提名奖”和“技术竞赛奖”、ICCV 2017“视频问答LSMDC Challenge”第一名;指导博士生获得2021年度“中国图象图形学学会(CSIG)优秀博士学位论文奖”;近年来承担国家重点研发、自然基金重点、科技创新特区和基础加强等项目和课题的研究任务。



1672280924864090.png

李海丰

中国民航大学副教授,计算机科学与技术学院副院长

主持人简介:李海丰,博士,硕士生导师,中国民航大学计算机科学与技术学院副院长,美国德州农工大学联合培养博士(2010-2011)、访问学者(2017-2018)。天津市“131创新型人才”第二层次,天津市“向上向善好青年”,天津市工程专业学位优秀指导教师,民航科技重点领域创新团队核心成员,中国民航大学“蓝天青年学者”,国家科技部专家库成员。中国计算机学会青年科技论坛(CCF YOCSEF)天津主席(2021-2022)并获评全国优秀分论坛主席,中国计算机学会计算机应用专委会执行委员,中国计算机学会智能机器人专委会委员。主要研究方向:智慧机场理论与系统、智能机器人感知技术。主持国家重点研发计划课题1项、国家自然科学基金1项,承担省部级以上科研项目6项。在IEEE 汇刊、《中国科学》、《自动化学报》、ICRA、IROS等国内外重要学术期刊及CCF推荐国际会议发表论文50余篇。以第一发明人获国家发明专利授权6项。


1672281056755039.png

刘才华

中国民航大学计算机科学与技术学院讲师


主持人简介:刘才华,博士,硕士生导师,中国民航大学讲师。天津市重点领域创新团队“航空大数据智能”团队核心成员,民航智慧机场理论与系统重点实验室核心成员。中国图象图形学学会交通视频专委会以及中国图象图形学学会机器视觉专委会委员、天津市人工智能学会理事、CCF YOCSEF天津2022-2023学术秘书。主要研究方向为计算机视觉以及人工智能在民航领域的应用。主持民航局重点实验室课题多项,作为主要参与者参与国家重点研发计划,国家自然科学基金、天津市自然科学基金多项;以第一作者或通讯作者发表SCI/EI论文二十余篇,授权专利2项。ICDAR2011 Book Structure Extraction竞赛第二名、ICMLC2015、NLPCC2016 best paper.