OpenAI发布新一代o1模型:引领人工智能的思考革命

图片

OpenAI最新发布的o1模型引起了广泛关注,该模型被描述为“更大、更强、更慢、更贵”。

图片

o1模型的发布与特点

北京时间今天凌晨,OpenAI正式推出了名为OpenAI o1的新模型,这一模型早前被称为“草莓”模型,最初代号为“Q*”。OpenAI的CEO萨姆·奥尔特曼(Sam Altman)表示,这标志着“新范式的开始”。

根据OpenAI的官方信息,o1模型的特点可以概括为:更大、更强、更慢、更贵。通过强化学习,o1在推理能力方面取得了显著进展。研发团队发现,随着训练时间和计算思考时间的增加,o1的表现不断提升。这表明,该模型的扩展面临的挑战与大型语言模型的预训练限制大相径庭。

图片

o1的功能与应用

关于o1模型是否具备自主执行浏览器或系统操作的能力,目前公开信息并未明确提及该功能。OpenAI表示,虽然当前版本尚未实现网上搜索和文件上传等功能,但在解决复杂推理问题上已有显著进步,代表了人工智能技术的新水平。因此,o1主要应用于通过文本交互进行问题解答和分析,而非直接控制浏览器或操作系统。

与早期版本相比,o1模型在回答问题前会进行“深思熟虑”,耗时大约10至20秒,以形成详细的内部思路链,尝试不同策略并识别自身错误。这种强大的推理能力使o1在科学、数学和编程等多个领域展现了广泛的应用潜力。在处理物理、化学和生物问题时,o1的表现甚至达到了博士生的水平。在国际数学奥林匹克的资格考试中,o1的正确率为83%,而GPT-4o的正确率仅为13%。

图片

OpenAI提供了多个具体的使用案例,例如,医疗研究人员可以利用o1标注细胞测序数据;物理学家则可使用o1生成量子光学所需的复杂数学公式;软件开发者可借助o1构建和执行复杂的多步骤工作流程等。

o1系列包括三款模型:OpenAI o1、OpenAI o1-preview和OpenAI o1-mini,后两款模型即日起对用户开放使用:

  • OpenAI o1:高级推理模型,暂不对外开放。
  • OpenAI o1-preview:注重深度推理处理,每周可使用30次。
  • OpenAI o1-mini:高效、划算,适用于编码任务,每周可使用50次。

开发者和研究人员现在可以通过ChatGPT和应用程序编程接口访问这些模型。

o1的定价与市场反应

关于定价,早前有消息称OpenAI计划将新模型“草莓”和“猎户座”的价格定在每月2000美元,这引发了广泛讨论。然而,今日发现,ChatGPT Pro会员的价格已定为200美元/月。这一价格的巨幅下降让人很难不觉得是“占便宜”,显现出OpenAI在价格策略上的精明。

今年5月,奥尔特曼曾提到,未来的GPT-5可能会将数据与推理引擎分离。他表示,训练大量数据是实现最佳推理引擎的唯一途径,但模型在处理数据时的资源浪费问题亟需解决。尽管这一设想在今日发布中未被实现,但它预示着OpenAI的未来发展方向。

加深推理能力的“思维链”

图片

大模型长期以来因缺乏结构化推理能力而受到批评。推理是人类智能的核心能力之一,而大模型主要通过非结构化文本数据进行训练,导致其在逻辑推理任务中表现不佳。为了解决这一问题,OpenAI引入了“思维链”技术,通过逐步解释每一步的推理过程,使模型能够像人类一样解决复杂的问题。

然而,手动标注思维链的过程繁琐且耗时,强化学习成为了更实用的替代方案。通过实践与试错,模型能够自主学习并优化解决问题的方法。例如,借助自我对弈,AlphaGo通过强化学习不断优化其决策模型,从而战胜顶级围棋选手。

o1模型采用类似的方式逐步处理问题,通过强化学习不断完善思考过程,识别和纠正错误,使复杂步骤变得简单化。这种训练方式显著提升了o1的推理能力,使其能够更有效地解决问题。

OpenAI的联合创始人之一格雷格·布罗克曼对此表示自豪,称这是首次使用强化学习训练的模型。通过思维链技术,o1的思维能力得到了显著提升。

图片

此外,o1技术在安全性方面也展现出良好表现。通过增强模型的深层推理能力,o1提高了对抗攻击的鲁棒性,减少了幻觉现象的风险。OpenAI表示,基于o1模型开发的一个新模型已参加了2024年国际信息学奥林匹克比赛,并在同条件下表现出色。

OpenAI所面临的挑战

图片

在o1发布之前,OpenAI公司经历了高层变动的风波。今年2月,创始成员安德烈·卡帕斯宣布离开,随后前首席科学家伊利亚·苏茨克维也宣布辞职,业内普遍认为这是OpenAI在追求技术突破与确保AI安全之间平衡失败的表现。

在接下来的几个月中,OpenAI内部分裂和高管离职问题加剧,最终导致公司内部关系紧张,加上高达50亿美元的预计亏损,OpenAI面临着巨大的财务压力。

为了应对这一局面,OpenAI正在积极寻求新一轮融资,预计融资额度将高达65亿美元。公司高管正在全球范围内寻找投资机会,以支持其快速发展的资金需求。