文章

ChatGPT Images 2.0 发布:OpenAI 图像生成进入新纪元

ChatGPT Images 2.0 发布:OpenAI 图像生成进入新纪元

2026 年 4 月 21 日,OpenAI 正式发布 ChatGPT Images 2.0,通过 ChatGPT 及 Codex 向用户推送。官方将其定义为”图像生成的新纪元”。

目前 ChatGPT 每周图像产出已超过 10 亿张

核心升级

1. 指令遵循与细节呈现显著提升

OpenAI 官方表示,Images 2.0 在指令遵循和细节呈现方面有显著提升。这意味着模型能更准确地理解用户的生成需求,输出更符合预期的图像。

2. 付费”深度思考”机制

Images 2.0 引入了付费开放的”深度思考”(Deep Thinking)机制,重点强化了:

  • 复杂图表生成(流程图、架构图、数据可视化)
  • 科学示意图(分子结构、电路图等)

这是 OpenAI 将 reasoning 能力从文本扩展到图像的一次尝试,瞄准专业用户市场。

3. 多画幅支持

新版本支持三种画幅比例:

  • 横向(Horizontal):适合演示文稿、网页横幅
  • 正方形(Square):适合社交媒体头像、常规插图
  • 纵向(Vertical):适合移动端屏幕、海报设计

API 定价

Images 2.0 的底层模型是 gpt-image-2,已在 OpenAI API 上线。具体定价请参考 OpenAI 官方定价页

战略意义

关闭 Sora,聚焦图像

OpenAI 在发布 Images 2.0 的同时,已经关闭了 Sora 视频生成工具。这说明 OpenAI 正在精简产品线,将图像生成作为核心产品方向持续投入。

为 IPO 铺路

每周 10 亿张图像的产出量,本身就是一个强有力的增长故事。精简产品线、强化核心产品、推出付费高级功能——典型的 IPO 前动作。

在 Ofox 上使用

gpt-image-2 已在 Ofox 平台接入,可以直接通过 Images API 调用:

  • 无需海外信用卡,支持支付宝/微信支付
  • OpenAI 兼容协议,标准 Images API 格式,迁移零成本
  • 按量计费,无月费门槛

我的看法

Images 2.0 最值得关注的是”深度思考”机制的引入。这意味着 OpenAI 正在把 reasoning 能力从文本扩展到图像——图像生成不再是简单的”文本→图像”映射,而是加入了规划和推理的环节。

图像生成正在从”艺术工具”变成”思维工具”。


本文首发于 Cobb’s Blog,同步发布于掘金、简书。

OfoxAI · 你的AI开发伙伴 — https://ofox.ai

本文由作者按照 CC BY 4.0 进行授权