ChatGPT Images 2.0 发布:OpenAI 图像生成进入新纪元
ChatGPT Images 2.0 发布:OpenAI 图像生成进入新纪元
2026 年 4 月 21 日,OpenAI 正式发布 ChatGPT Images 2.0,通过 ChatGPT 及 Codex 向用户推送。官方将其定义为”图像生成的新纪元”。
目前 ChatGPT 每周图像产出已超过 10 亿张。
核心升级
1. 指令遵循与细节呈现显著提升
OpenAI 官方表示,Images 2.0 在指令遵循和细节呈现方面有显著提升。这意味着模型能更准确地理解用户的生成需求,输出更符合预期的图像。
2. 付费”深度思考”机制
Images 2.0 引入了付费开放的”深度思考”(Deep Thinking)机制,重点强化了:
- 复杂图表生成(流程图、架构图、数据可视化)
- 科学示意图(分子结构、电路图等)
这是 OpenAI 将 reasoning 能力从文本扩展到图像的一次尝试,瞄准专业用户市场。
3. 多画幅支持
新版本支持三种画幅比例:
- 横向(Horizontal):适合演示文稿、网页横幅
- 正方形(Square):适合社交媒体头像、常规插图
- 纵向(Vertical):适合移动端屏幕、海报设计
API 定价
Images 2.0 的底层模型是 gpt-image-2,已在 OpenAI API 上线。具体定价请参考 OpenAI 官方定价页。
战略意义
关闭 Sora,聚焦图像
OpenAI 在发布 Images 2.0 的同时,已经关闭了 Sora 视频生成工具。这说明 OpenAI 正在精简产品线,将图像生成作为核心产品方向持续投入。
为 IPO 铺路
每周 10 亿张图像的产出量,本身就是一个强有力的增长故事。精简产品线、强化核心产品、推出付费高级功能——典型的 IPO 前动作。
在 Ofox 上使用
gpt-image-2 已在 Ofox 平台接入,可以直接通过 Images API 调用:
- 无需海外信用卡,支持支付宝/微信支付
- OpenAI 兼容协议,标准 Images API 格式,迁移零成本
- 按量计费,无月费门槛
我的看法
Images 2.0 最值得关注的是”深度思考”机制的引入。这意味着 OpenAI 正在把 reasoning 能力从文本扩展到图像——图像生成不再是简单的”文本→图像”映射,而是加入了规划和推理的环节。
图像生成正在从”艺术工具”变成”思维工具”。
本文首发于 Cobb’s Blog,同步发布于掘金、简书。
OfoxAI · 你的AI开发伙伴 — https://ofox.ai
本文由作者按照
CC BY 4.0
进行授权