一、初探认知智能,植根交叉视野
“如果我们能让机器像人类一样理解语言和世界,会发生什么?”博士期间,黄岩在导师指导下接触到认知心理学与人工智能的交叉研究,对人类感知、记忆与决策机制产生了浓厚兴趣。彼时,多模态感知仍以模式拼接为主,缺乏解释力和系统性。他敏锐意识到,“认知驱动的人工智能”将是下一个重要突破口。
二、提出理论框架,奠定研究根基
在入选第六届青托工程后,他潜心思考如何从“碎片化模型”走向“统一性建模”。最终,结合认知心理学关键机制,他系统提出了“多认知机制协同建模”理论框架,不仅明确了感知—注意—记忆—推理—决策的全过程建模路径,也成为后续模型设计的“总图纸”,相关成果被Springer出版社约稿出版专著,受学界学者关注。
三、深耕细作,解锁关键技术难题
围绕多模态图文匹配与导航推理,他持续攻坚“知识稀缺”、“场景泛化”等问题。面对少样本匹配任务难以收敛的挑战,他创新性提出多模态共享记忆机制,解决了知识迁移效率低下的问题;在视觉-语言导航场景中,他提出邻域视角推理模型,显著提高机器人空间认知与路径规划能力,取得多个任务指标最优成绩。
四、融合工程平台,实现从理论到实践
黄岩深知科研不能停留在“论文模型”。在项目支持下,他主导构建机器人多模态认知交互平台,将视觉识别、语音识别、路径规划等模块集成到一套软硬件闭环系统中。在真实家庭环境中,机器人能识别用户语言指令,自主识别场景、规划路径并精确完成任务,实现了从算法研究到系统验证的关键跨越。
五、以赛促研,摘得国际桂冠
在国际具身智能赛事中,他带领团队聚焦“跨模态导航”这一难题,提出一套结合语言驱动定位、视觉推理匹配的创新算法,在训练样本极度稀缺的情况下,实现导航成功率提升3%以上,荣获2022年Google主办的RxR Habitat竞赛冠军。随后,他们在ICCV AVDN竞赛中再次夺冠。这不仅是科研成果的验证,也为国内青年科技人才在国际舞台赢得了掌声与尊重。
六、传帮带育人,打造青年梯队
他始终把“培养后继力量”作为重要使命,在项目期间协助培养近10位硕博士生,其中多人获中科院院长奖学金等奖励。在教学中,他以“科研即解决问题”为导向,鼓励学生参与真实任务、挑战难点问题,激发他们的科研兴趣和自主成长意愿。正因如此,团队成为了“能战斗、有成果、有活力”的青年科研力量代表。
七、学术担当,服务科研共同体
作为青年学者,黄岩主动承担学术服务责任。他担任CVPR/ICCV领域主席,担任CCF计算机视觉专委副秘书长、CSIG视觉大数据专委会委员等,组织CSIG青托沙龙、CVPR中国论文分享会等系列活动,构建起连接青年科研者与一线专家的桥梁。
从提出认知智能的创新构想到落地多模态系统平台,从挑战世界级赛事难题到维护青年学术生态,黄岩用实干和创新绘出一条“理论—技术—应用”的完整成长轨迹。
Copyright © 2025 中国图象图形学学会 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190