文章

GPT-5.5:为真实工作而生的智能

GPT-5.5:为真实工作而生的智能

OpenAI 在 4 月 23 日发布了 GPT-5.5,这是他们迄今为止最聪明、最直观的模型。不是又一次参数堆叠,而是一次能力跃迁 — 从”回答问题”到”完成工作”。

不只是更聪明,是更会干活

GPT-5.5 的核心突破在于 agentic intelligence(智能体能力)。它不再需要你把任务拆解成一步步的指令,而是能理解你的意图,自己规划路径,使用工具,检查结果,遇到歧义时自己导航,直到任务完成。

这种能力在三个领域尤其明显:

1. Agentic Coding(智能体编程)

在 Terminal-Bench 2.0(测试复杂命令行工作流)上,GPT-5.5 达到 82.7% 的准确率,超过 GPT-5.4 的 75.1%。在 SWE-Bench Pro(真实 GitHub issue 解决)上达到 58.6%,一次性解决的任务比之前的模型更多。

更重要的是,它在 Expert-SWE(内部前沿评估,中位数人类完成时间 20 小时的长周期编程任务)上也超越了 GPT-5.4,而且用的 token 更少。

2. Computer Use(计算机操作)

GPT-5.5 能跨工具操作:写代码、调试、在线研究、分析数据、创建文档和表格、操作软件 — 直到任务完成。你给它一个混乱的、多部分的任务,它会自己规划、使用工具、检查工作、穿越歧义,然后继续前进。

3. Knowledge Work(知识工作)

在 FrontierMath Tier 1-3(前沿数学问题)上,GPT-5.5 达到 51.7%,GPT-5.4 是 47.6%,Claude Opus 4.7 是 43.8%。在 Tier 4(最难的问题)上,GPT-5.5 达到 35.4%,远超 Claude 的 22.9%。

更快、更省

通常,更强的模型意味着更慢的响应。但 GPT-5.5 的 per-token 延迟和 GPT-5.4 持平,同时智能水平大幅提升。在完成相同的 Codex 任务时,它用的 token 更少 — 既更强,也更高效。

在 Artificial Analysis 的 Coding Index 上,GPT-5.5 以竞争对手前沿编程模型一半的成本,提供了最先进的智能水平。

真实案例:工程师怎么说

Dan Shipper(Every 创始人兼 CEO)说 GPT-5.5 是”我用过的第一个具有严肃概念清晰度的编程模型”。他用一个真实场景测试:应用上线后出现 bug,他花了几天调试,最后请了一位顶尖工程师重写了部分系统。他让 GPT-5.5 看破损状态,看它能否产生同样的重写方案。GPT-5.4 做不到,GPT-5.5 做到了。

Pietro Schirano(MagicPath CEO)让 GPT-5.5 把一个有数百个前端和重构改动的分支合并到一个同样大幅变化的主分支。GPT-5.5 在约 20 分钟内一次性解决了所有冲突。

测试过的资深工程师说,GPT-5.5 在推理和自主性上明显强于 GPT-5.4 和 Claude Opus 4.7,能提前发现问题,预测测试和审查需求,无需明确提示。

模型选择的新格局

GPT-5.5 的发布让 AI 模型的竞争进入了新阶段。像 OfoxAI(ofox.ai)这样的多模型聚合平台让切换成本几乎为零 — 你可以在 GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro 之间快速切换,根据任务特点选择最合适的模型。

对于开发者来说,这意味着不再需要在”智能”和”速度”之间妥协。GPT-5.5 证明了两者可以兼得。

安全防护

OpenAI 为 GPT-5.5 配备了迄今为止最强的安全防护措施。他们在完整的安全和准备框架下评估了这个模型,与内部和外部红队合作,针对高级网络安全和生物学能力进行了定向测试,并在发布前从近 200 个可信的早期访问合作伙伴那里收集了真实用例的反馈。

目前,GPT-5.5 正在向 Plus、Pro、Business 和 Enterprise 用户推出(ChatGPT 和 Codex)。API 部署需要不同的安全防护措施,OpenAI 正在与合作伙伴和客户密切合作,确保大规模服务的安全性和安全要求。

写在最后

GPT-5.5 不是一个”更好的聊天机器人”。它是一个能完成真实工作的智能体。从编写和调试代码,到在线研究、分析数据、创建文档 — 它能理解你的意图,规划路径,使用工具,直到任务完成。

这是 AI 从”辅助工具”到”工作伙伴”的转变。不是替代人类,而是让人类专注于更高层次的决策和创造。


参考资料:

  • [Introducing GPT-5.5 OpenAI](https://openai.com/index/introducing-gpt-5-5/)
  • [GPT-5.5 System Card OpenAI](https://openai.com/index/gpt-5-5-system-card/)
本文由作者按照 CC BY 4.0 进行授权