12月26日,由中国图象图形学学会(CSIG)主办、CSIG青托俱乐部承办的第八期“CSIG理事荟”活动在线上成功召开。本次活动主题为“畅谈OpenAI十二天发布会”,由南开大学刘夏雷副教授担任主持人,活动邀请到浙江大学吴飞教授(CSIG理事)、北京航空航天大学史振威教授(CSIG理事)、华南理工大学金连文教授(CSIG常务理事)三位专家担任特邀嘉宾。此外,活动邀请到北京大学袁粒助理教授和上海人工智能实验室王文海青年科学家担任与谈嘉宾。
刘夏雷副教授在开场时简要回顾了OpenAI在近期发布会中推出的多项关键技术,第一个环节是和嘉宾们探讨如何看待 OpenAI 在发布会中提出的最新技术进展,对行业和研究方向可能产生哪些影响。
吴飞教授指出,大家期待的GPT-5未发布,实际上是由于“大语言模型扩展定律”可能已经遇到了瓶颈。以前,随着参数规模、算力和数据量的增加,模型性能会提升,但最近的经验表明,GPT-4到GPT-5的性能提升远不如从GPT-3到GPT-4的提升。同时,OpenAI通过在推理端加入思维链和强化学习微调等技术,投入更多资源进行“慢思考”,帮助解决复杂的问题。他对推理技术的进展表示乐观,认为推理领域有极大的潜力。
金连文教授认为,尽管GPT-5没有发布,但O3模型无论在编程能力、数学能力,还是复杂推理能力方面,都是革命性的突破。他强调,O3模型的能力不仅可以超过大部分人类顶尖选手,尤其在复杂数学和推理任务中的表现。金教授还对OpenAI在商业应用中的进展表示关注,特别是集成了实时搜索功能的GPT模型,能够实现无缝的信息检索,这一功能可能会颠覆传统的搜索引擎,成为未来信息检索和处理的新标准。
史振威教授总结了OpenAI的技术发展脉络,从最初的GPT系列到最近的多模态技术和API工具,展示了OpenAI从量变到质变的演进过程。他指出,OpenAI持续推进自回归模型,并且通过不断扩展模型和工具,提升了推理能力和应用性能。史教授强调,OpenAI的成功在于它坚持自回归模型的设计理念,通过不断改进自回归模式,OpenAI能够不断突破复杂任务的能力,这为AGI的实现打下了基础。
王文海博士非常关注OpenAI的高阶推理能力,特别是O3模型的编程和科学推理能力。他提到,O3模型在编程能力上已经达到了国际大师级别,这表明大模型在解决前沿科研问题上具有巨大的潜力。王博士进一步探讨了AI如何帮助科研人员,特别是在遇到复杂问题时,如何通过将问题精准描述给AI来加速解决方案的获得。
袁粒助理教授从多模态的角度进行了讨论。他认为,尽管OpenAI在语言处理上已经接近AGI的水平,但当前的技术仍然局限于单模态(语言)。他指出,语言是一个抽象的模态,超越了人类,但要实现AGI,AI需要同时具备视觉、语言等多模态理解能力,特别是在理解和生成图像、视频等具象信息方面,当前的技术仍显不足。袁教授提到,尽管Sora能够生成视频,但它并不能理解自己生成的内容,这反映出AI模型在跨模态任务中的局限性。他对Sora的期待未能完全实现表示失望,并提出,未来的AGI应能在多个模态之间自由切换并理解所有模态的交互,而不是仅仅在某一个模态上取得突破。
第二个环节探讨了在国内科研环境下,如何借鉴 OpenAI 的科研模式,做出有影响力的工作。
吴飞教授认为OpenAI的成功部分源于其将人工智能视为应用驱动的工具,展示算法的有效性和先进性,通过实际应用推广技术。其次,OpenAI能在面对瓶颈时迅速调整方向,采用新的突破性策略,尤其是在扩展模型和强化学习结合方面,展示了高度的适应性。并强调了多算法集成的重要作用,包括深度学习、强化学习和搜索技术的有机集成,是解决实际问题的关键。
金连文教授认为OpenAI每年发表的论文数量不多,但每篇的影响力巨大。这个现象启发我们要关注长远的研究目标,不仅仅追求短期成果。特别赞赏OpenAI敢于冒险进行大规模的计算和突破性技术尝试,尽管付出了巨大的成本。提到OpenAI在推理、安全性等领域的探索,强调了创新背后的高成本和战略眼光。
史振威教授认为OpenAI成功的核心是明确的远大目标和坚定的信念,分阶段推进,坚信自回归的GPT模型能够接近人工智能的终极解决方案。看好OpenAI如何在多个阶段实现突破,不仅专注于技术突破,还能适时结合多模态发展,带动领域的进步。
王文海博士认为OpenAI的成功源于其极简的核心思想和研究策略,通过简单有效的思路推动技术发展,这对他自己的科研工作有所启发。提到OpenAI的科研组织形式和资源分配方法,能够集中优势资源,并注重团队协作,推动长期的科研项目。强调OpenAI的容错机制,特别是在GPT初期不被看好时,OpenAI依然坚持长期的研发路径,最终成功。
袁粒助理教授谈到国内科研环境的现实问题,例如需要在短期内取得成果来回应资源的投入。与OpenAI不同,国内很多研究面临资金和资源的限制,无法完全追求长期的创新。
第三个环节探讨了广大CSIG会员朋友们关心的问题,在大模型时代,青年研究者如何选题才能既有前瞻性又具备可执行性。
吴飞教授强调大模型的研究应更多集中在“垂直领域的大模型”上,即针对某些特定学科或任务(如化学、数学、代码生成等)进行优化,而不是追求一个通用的大模型。
金连文教授认为大模型时代有许多值得研究的课题,尤其是基础性问题,虽然高校在设备和资金上存在局限,但仍然有广阔的研究空间。提到大模型的研究可能改变科研方法,尤其是自动化的模型自主学习和微调。强调大模型的能力在科学研究中的应用潜力,尤其是如何将大模型应用于解决科学问题。
史振威教授指出OpenAI的收费问题和核心技术封闭性,认为其“CloseAI”的策略可能不利于技术的推广和发展。提倡开源,认为通过开源可以推动科技进步,并且建议国内学者聚焦垂直领域的研究,特别是响应国家重大需求。
王文海博士认同垂直领域的研究是未来发展的一个重要方向,并强调开源社区的力量。认为不同领域的知识积累和数据集合对于大模型的改进至关重要,尤其是通过领域特定的评测和数据来完善模型。
袁粒助理教授强调“大模型”并非万能,尤其在某些领域中,专业知识的需求限制了普通大模型的应用。提出AI与科学领域结合的机会,尤其是AI在特定科学问题中的应用,并指出专业领域的参与者需要贡献自己的数据和标注,以促进通用AI的发展。
最后,主持人刘夏雷副教授对本次活动进行了总结,再次感谢各位嘉宾分享的精彩观点,并感谢线上朋友们的热情参与。随着2025年新年的临近,祝愿各位朋友新年快乐,心想事成!期待在下次“CSIG理事荟”活动中再会!
Copyright © 2025 中国图象图形学学会 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190