文章

GPT-Rosalind:OpenAI 发布首个生命科学专用推理模型

GPT-Rosalind:OpenAI 发布首个生命科学专用推理模型

作为 OfoxAI(ofox.ai)的开发者,我每天都在跟踪各家模型的动态。昨天 OpenAI 发了一个让我眼前一亮的东西 —— GPT-Rosalind,一个专门为生命科学研究打造的前沿推理模型。

这不是又一个通用大模型的版本号升级。这是 OpenAI 第一次为特定垂直领域发布专用模型系列。

为什么叫 Rosalind

模型以 Rosalind Franklin 命名 —— 她的 X 射线晶体学研究揭示了 DNA 的双螺旋结构,奠定了现代分子生物学的基础。这个命名本身就说明了 OpenAI 对这个模型的定位:不是锦上添花,是要动基础设施。

解决什么问题

一个新药从靶点发现到获批上市,在美国平均需要 10-15 年。这个周期里,早期发现阶段的效率提升会在下游产生复利效应 —— 更好的靶点选择、更强的生物学假设、更高质量的实验设计。

但现实是,科学家的研究工作流极度碎片化:海量文献、专业数据库、实验数据、不断演化的假设,这些东西之间的连接大量依赖人工。GPT-Rosalind 要做的,就是在这些环节之间建立 AI 驱动的桥梁。

能力边界

GPT-Rosalind 在几个关键维度上展现了超越通用模型的能力:

  • 化学反应机制推理
  • 蛋白质结构、突变效应和相互作用分析
  • DNA 序列的系统发育解读
  • 实验输出解读和后续实验设计
  • 跨 50+ 公共多组学数据库和文献源的工具调用

在 BixBench(生物信息学基准测试)上,GPT-Rosalind 在已公开分数的模型中取得了领先表现。在 LABBench2 的 11 项研究任务中,有 6 项超越了 GPT-5.4。

更有说服力的是与 Dyno Therapeutics 合作的评估:在 RNA 序列到功能的预测任务中,模型的最佳提交排在人类专家的第 95 百分位以上;在序列生成任务中排在第 84 百分位。

Codex 生命科学插件

配合 GPT-Rosalind,OpenAI 同步开源了一个 Life Sciences Research Plugin,提供了一套模块化的研究技能包,覆盖人类遗传学、功能基因组学、蛋白质结构、生物化学、临床证据等领域。

这个插件本质上是一个编排层,帮助科学家处理那些宽泛、模糊、多步骤的研究问题。它接入了 50+ 公共数据库和生物学工具,提供了蛋白质结构查询、序列搜索、文献综述、公共数据集发现等常见工作流的起点。

我的判断

这件事的意义不在于 GPT-Rosalind 本身有多强,而在于它代表的方向:垂直领域专用模型

过去两年,所有人都在卷通用能力 —— 更大的上下文、更强的推理、更好的代码生成。但通用模型在专业领域的天花板是明确的:它们缺乏领域特定的工具使用能力,缺乏对专业工作流的深度理解。

OpenAI 选择生命科学作为第一个垂直切入点,逻辑很清晰:这个领域数据密集、工作流复杂、加速研发的经济价值巨大。Amgen、Moderna、Thermo Fisher 这些合作伙伴的名单也说明了市场需求的真实性。

接下来值得关注的是:Anthropic 和 Google 会不会跟进?垂直模型会不会成为下一个竞争维度?

从技术趋势看,通用模型 + 垂直微调 + 领域工具链,可能是 AI 在专业领域真正落地的范式。GPT-Rosalind 是这个范式的第一个大规模实践。


药物研发 10-15 年的周期,如果 AI 能把早期发现阶段压缩哪怕 20%,下游的复利效应就是以十亿美元计的。这不是 hype,是数学。

本文由作者按照 CC BY 4.0 进行授权