登录会员系统  |  联系我们  |  加入学会  
奖励与推荐
【青年人才成长故事】科研路漫漫,全面发展定基础--叶茫
发布时间:2025-05-26      来源:中国图象图形学学会      分享:

智慧城市的建设是社会共同努力的目标。自研究生阶段起,叶茫老师专注于行人重识别方向的研究,该方向是智慧城市的重要技术支撑。入职武汉大学后,在中国科协青托等项目的支持下,叶茫老师拓展了他的研究领域,围绕多模态目标检索、多模态语义理解和数据隐私保护等方面开展研究,为智慧城市的整体目标奠定了坚实的基础。

1.在多模态目标检索方面:目标检索是一个长期发展的问题,但也必须要与目前的技术发展相结合才能更好的在实际应用中发挥作用。带着这个目标,叶茫老师指导团队针对实际复杂场景下的多模态检索问题,探讨了通用多模态大模型在下游目标检索任务上的泛化性研究,构建了一个模态无关的多模态目标检索基础模型,支持可见光、文本、素描等多种模态的组合检索,模型泛化率在多个跨模态/多模态目标检索任务中均取得了较高的准确率,成果获2021年无人机场景下的目标检索冠军,2023年第四届CSIG图像图形技术挑战赛-行人属性识别赛道比赛亚军。单篇引用超过2000次,获2023年湖北省优秀科技论文,跨模态目标检索技术在海信集团智能电视和浙江每日互动智慧社区等项目中转化落地应用。

2.在多模态语义理解方面:从常规的识别数据内容到在多模态场景下把握用户的情感意图需求变得逐渐重要。根据这个趋势,叶茫老师指导团队针对社交场景的模态不确定性问题,构建了领域内第一个大规模多模态语义情感意图理解数据集,将多模态的内容感知检索拓展到多模态的语义理解,同时搭建了一个面向情感、意图等语义理解任务的方法基准,形成了多模态语义理解大模型EmoBench。

3.在数据隐私保护方面:在金融、医疗等领域数据的获取存在困难,利用联邦学习打破这一壁垒能够为智慧城市的构建添砖加瓦。带着这种期望,叶茫老师指导团队针对联邦学习中的数据异构、模型异构、标签噪声和数据损坏等异构难题展开了一系列研究,构建了一个支持10多种异构联邦学习的方法框架,克服了数据分布差异和模型结构异质等问题。系统分析了异构联邦学习领域的挑战和进展,撰写了首篇异构联邦学习综述文章,发表在顶级期刊ACM Computing Surveys。相关成果与绿盟科技、华为等企业开展技术合作落地。

科研路漫漫,人才培养不停歇

在科研探索的漫漫征途上,叶茫老师深谙人才培养之道。他以团队成员的科研兴趣为引导,精心构建每个任务的小型研究团队,旨在激发团队成员的潜能。在科研的初期部署阶段,团队成员之间相互协助、合作探讨,形成了一种密切的合作模式。这种模式不仅充分发挥了每位研究者的创造力和协作能力,更为团队成员提供了一个开放的交流平台,促进了思想碰撞和灵感的共享。同时,这种紧密的合作还为团队成员提供了在研究选择和发展中的指导和支持,鼓励他们勇于尝试新的研究方向。这种充满自主性的科研模式,使得每位研究人员能够在自我探索中形成独特的研究思路,不断深化对自身研究方向的理解与把握。因此,叶茫老师在科研路上的引导不仅是一种方法论,更是对人才培养不停歇的有力践行。

科研路漫漫,未来坚持扬远帆

科学研究永无止境,其道路曲折艰险,需要不断的探索和挑战。在多模态目标检索、多模态语义理解和隐私保护等领域的研究中,叶茫老师领导团队将持续前行,努力开拓创新。特别是在智能医疗诊断方面,将投入更多精力,通过结合图像、文本、声音等多种模态信息,不断改进医疗诊断的准确性和效率,为医生提供更好的诊断与治疗建议,助力智慧医疗的发展。同时,为了保障患者隐私,叶茫老师团队将不断探索新的隐私保护技术,确保患者数据的安全性和隐私性。未来,叶茫老师团队将继续不畏艰险,坚持追求真理,扬起远帆,向着未知的领域进发,推动人工智能技术在更多领域的应用,为构建智慧社会、实现健康中国贡献力量。愿科研之路,照亮未来方向,造福人类健康与幸福。



Copyright © 2025 中国图象图形学学会 京公网安备 11010802035643号   京ICP备12009057号-1

地址:北京市海淀区中关村东路95号 邮编:100190

技术支持:中科服