GPT-Rosalind：OpenAI 发布首个生命科学专用推理模型

发表于 2026/04/17

作者

5 分钟阅读

作为 OfoxAI（ofox.ai）的开发者，我每天都在跟踪各家模型的动态。昨天 OpenAI 发了一个让我眼前一亮的东西 —— GPT-Rosalind，一个专门为生命科学研究打造的前沿推理模型。

这不是又一个通用大模型的版本号升级。这是 OpenAI 第一次为特定垂直领域发布专用模型系列。

为什么叫 Rosalind

模型以 Rosalind Franklin 命名 —— 她的 X 射线晶体学研究揭示了 DNA 的双螺旋结构，奠定了现代分子生物学的基础。这个命名本身就说明了 OpenAI 对这个模型的定位：不是锦上添花，是要动基础设施。

一个新药从靶点发现到获批上市，在美国平均需要 10-15 年。这个周期里，早期发现阶段的效率提升会在下游产生复利效应 —— 更好的靶点选择、更强的生物学假设、更高质量的实验设计。

但现实是，科学家的研究工作流极度碎片化：海量文献、专业数据库、实验数据、不断演化的假设，这些东西之间的连接大量依赖人工。GPT-Rosalind 要做的，就是在这些环节之间建立 AI 驱动的桥梁。

GPT-Rosalind 在几个关键维度上展现了超越通用模型的能力：

在 BixBench（生物信息学基准测试）上，GPT-Rosalind 在已公开分数的模型中取得了领先表现。在 LABBench2 的 11 项研究任务中，有 6 项超越了 GPT-5.4。

更有说服力的是与 Dyno Therapeutics 合作的评估：在 RNA 序列到功能的预测任务中，模型的最佳提交排在人类专家的第 95 百分位以上；在序列生成任务中排在第 84 百分位。

配合 GPT-Rosalind，OpenAI 同步开源了一个 Life Sciences Research Plugin，提供了一套模块化的研究技能包，覆盖人类遗传学、功能基因组学、蛋白质结构、生物化学、临床证据等领域。

这个插件本质上是一个编排层，帮助科学家处理那些宽泛、模糊、多步骤的研究问题。它接入了 50+ 公共数据库和生物学工具，提供了蛋白质结构查询、序列搜索、文献综述、公共数据集发现等常见工作流的起点。

这件事的意义不在于 GPT-Rosalind 本身有多强，而在于它代表的方向：垂直领域专用模型。

过去两年，所有人都在卷通用能力 —— 更大的上下文、更强的推理、更好的代码生成。但通用模型在专业领域的天花板是明确的：它们缺乏领域特定的工具使用能力，缺乏对专业工作流的深度理解。

OpenAI 选择生命科学作为第一个垂直切入点，逻辑很清晰：这个领域数据密集、工作流复杂、加速研发的经济价值巨大。Amgen、Moderna、Thermo Fisher 这些合作伙伴的名单也说明了市场需求的真实性。

接下来值得关注的是：Anthropic 和 Google 会不会跟进？垂直模型会不会成为下一个竞争维度？

从技术趋势看，通用模型 + 垂直微调 + 领域工具链，可能是 AI 在专业领域真正落地的范式。GPT-Rosalind 是这个范式的第一个大规模实践。

药物研发 10-15 年的周期，如果 AI 能把早期发现阶段压缩哪怕 20%，下游的复利效应就是以十亿美元计的。这不是 hype，是数学。

AI, Dev

openai gpt-rosalind life-sciences drug-discovery reasoning

本文由作者按照 CC BY 4.0 进行授权