跳至主要内容
返回博客
集成与生态

GPT Image 2 上线 Teno:更好的字体排版与精确的产品图编辑

GPT Image 2 已上线 Teno,为 AI 广告创意工作流带来可读的多语言文字、精确的图像编辑和更强的产品视觉。

Judy Liu

Judy Liu

内容负责人,Teno

14 分钟阅读
文章封面:GPT Image 2 上线 Teno:更好的字体排版与精确的产品图编辑

2026 年 4 月,OpenAI 发布了 GPT Image 2,带来 50+ 语言的原生字体渲染、网页搜索 grounding 的 thinking 模式,以及支持灵活多参考输入的图生图编辑能力(OpenAI,2026)。截至 5 月 5 日,文生图和编辑两条流程已在 Teno 上线。这次上线重塑了我们组装广告创意图像栈的方式,因为 GPT Image 2 第一次让文字密集型、多语言的创意真正达到了一类公民级的图像生成体验。

核心要点

  • 文生图和编辑两条流程今天同时上线——2026 年 5 月 5 日,所有付费计划可用,免费档位提供低质量档试用。
  • 多语言字体排版是头部能力。 GPT Image 2 在 50+ 文字系统中渲染准确文字,包括阿拉伯文、日文、韩文和天城文(Microsoft, Azure AI Foundry 博客,2026 年 4 月)。
  • 三档质量切换(低 / 中 / 高)让团队在同一个模型里完成提示词探索、可评审草稿和最终渲染,不用切换模型。
  • 和 Nano Banana Pro 互补,不是取代。 GPT Image 2 拿下字体和精确编辑,Nano Banana Pro 仍然把控角色一致性和产品主图。

这是一篇上线博客;在我们发布更长的实操指南之前,这也是 Teno 关于 GPT Image 2 的规范说明——它能做什么、适合放在哪、什么时候选它而不是其他图像模型。

GPT Image 2 是什么,有哪些新东西?

GPT Image 2 是 OpenAI 在 2026 年 4 月推出的新一代图像模型,2026 年 4 月 21 日面向 API、Codex 和 ChatGPT 全量用户发布(OpenAI,2026)。发布资料记录了 50+ 语言的原生字体准确度、带网页搜索的 thinking 模式、单条提示最多 8 张变体生成,以及支持灵活多参考输入的图生图编辑能力。在 Teno 上,今天暴露给广告团队的是这套能力的子集:提示词、图像尺寸、质量、出图数量、输出格式,编辑模式下加上多参考图像 URL。

对付费创意而言,有四项能力值得关注:

  • 小尺寸下也能撑住的多语言字体排版。 2024–2025 年的大多数图像模型勉强能画英文文字,碰到 CJK 或阿拉伯文就崩。GPT Image 2 在阿拉伯文、日文、韩文、中文、印地语、孟加拉语、西里尔字母、天城文和拉丁字母上都能渲染准确文字(Microsoft, Azure AI Foundry 博客,2026 年 4 月)。对在 5+ 市场出包装效果图或信息流图卡的跨境 DTC 团队,这一步压缩了过去必须用 Photoshop 在 AI 生成背景上叠加本地化文案的环节。
  • 带网页搜索的 thinking 模式。 模型可以在出图前抓取实时参考——当提示词依赖当前产品、Logo 或季节性背景时这很重要。代价是延迟变长,所以我们建议把它留给主图渲染,而不是批量测试。
  • 单条提示最多 8 张一致性变体。 一次生成返回的是一组连贯输出,而不是 8 个互相独立的随机版本——对网格布局、A/B 变体批次、分镜框架一次性生成很有用。
  • 多目标场景下的精确指令遵循。 GPT Image 2 在保持空间约束("Logo 在右上角、产品居中、手从画面左侧入场")方面比前几代更稳——这是 Teno 团队描述里特别强调"精细字体"和"精确图像编辑"的核心原因。

团队该如何在 Teno 上设置 GPT Image 2 的质量档位?

GPT Image 2 在 Teno 上提供了一个简单的质量调节:低(low)中(medium)高(high)。请把这个调节首先当成工作流控制使用。低用于提示词探索,中用于可评审的内部草稿,高用于最终创意——这种情况下字体、产品细节、布局精度都要经得起导出。

实操质量映射:

  • 低(low): 测试提示词方向、粗略布局、语言变体和文案位置的最快方式。
  • 中(medium): 创意评审的最佳检查点——想法接近成型但还没到能投放的程度。
  • 高(high): 包装、多语言社交图卡、产品主图,以及任何画面上有可读文字的素材的最终渲染设置。

默认的 landscape_4_3 + 高质量设置在 Teno 2026 年 5 月的模型目录中校准为每张 3 积分。积分与美元的换算按你的计划走;具体费率见 pricing。比这更重要的操作准则其实更简单:不要根据一次高质量生成评判一个提示词。先在低或中档探索想法,再把胜出的版本用高档重渲染。

这种"低到高"的模式和有经验的视频团队测 Seedance 或 Veo 提示词的做法是一致的:把创意探索和最终导出分开,让团队在打磨素材之前做出更好的品味判断。

什么时候用 GPT Image 2,什么时候用 Nano Banana Pro 或 Nano Banana 2?

对大多数付费创意团队,GPT Image 2 现在是画面带文字的任何素材的默认图像模型,包括包装效果图、多语言社交图卡、户外广告风格的版式、价格 / CTA 叠加。Nano Banana Pro 仍然是活动内反复出现角色或反复出现产品主图的最佳选择,而 Nano Banana 2 适合大批量背景和生活方式素材。三者谁都不能完全替代另一个;这个图像栈按任务自然分工。

一张快速对照表:

模型最擅长真实的取舍
Nano Banana 2大批量生活方式创意;灵活背景生成画面文字是三者里最弱的
Nano Banana Pro商业级角色和产品在同一活动内的一致性当字体排版是主交付物时,竞争力较弱
GPT Image 250+ 语言字体排版;精确多目标场景;多参考编辑反复出现角色的相似度,比 Nano Banana Pro 漂移更明显

给付费创意团队的决策规则:

  • 画面带文字的任何素材 → GPT Image 2。 包装、价签、CTA、多语言信息流图卡、户外广告风格效果图。
  • 同一品牌角色或主图产品反复出现 → Nano Banana Pro。 创始人镜头、品牌吉祥物、招牌 SKU。
  • 大批量背景和生活方式场景 → Nano Banana 2。 字体排版不是交付物时的强选择。
  • 起始帧 + 结束帧喂给 Seedance 2.0 图生视频 三者皆可,按这次转换中哪种能力最重要来选。

要把这一切放进更宏观的付费创意栈里看,请参考我们的 AI 广告创意平台指南

GPT Image 2 在哪些广告创意场景中表现最好?

GPT Image 2 在 Teno 上明显跑赢同侪的四个场景是:多语言社交图卡、包装与标签效果图、多目标镜头构图、基于参考的品牌编辑。这四种都归结到同一个底层能力——精准的小尺寸文字渲染加上严格的空间约束遵循——这正是 OpenAI 在这一代针对性优化的能力缺口(OpenAI,2026)。

几个实操样例:

  • 多语言社交图卡(DTC 一次出 4 市场)。 提示词:同一个产品主图,同一句标题的四个语言变体(英文 / 德文 / 日文 / 阿拉伯文)一次性生成。GPT Image 2 在四种文字系统中都能保持字体准确;以前的大多数模型会破坏阿拉伯文、产生接近字形的日文乱码。
  • 带合规文案的包装效果图。 护肤或保健品类,背面文案小、密、且与语言强相关。一条提示同时生成正面和背面版式;可以直接拿可读真文字进入法务评审,而不是占位的拉丁文 lorem。
  • 严格布局的多目标场景。 "产品主图居中、品牌 Logo 右上角、辅助道具在画面左、整体在柔和渐变背景上、自然日光。" GPT Image 2 能守住空间约束;早期图像模型经常把 Logo 自动迁移到中央。
  • 基于参考的编辑。 给编辑端点发 2–3 张参考图加一句提示词,模型会组合出一个尊重参考的新场景。最干净的用法是给一张已有的主图换上新季节的文案,而不需要重新生成整个版式。

我们的观察: 2026 年 5 月初我们跑的字体密集型广告概念中,GPT Image 2 在多语言提示上通常第一次或第二次出图就达到广告级;而上一代模型往往需要 4–6 次重试外加手工叠加文字层。

对喂给 Teno 视频模型的起始帧和结束帧,按要用的模型选择上游图像流:Product Photo 走它支持的栈(在产品驱动工作流中包含 Nano Banana Pro),Asset Generator 则负责需要用 GPT Image 2 生成的帧——目前只有这里能用到 GPT Image 2。

今天就在 Teno 上用 GPT Image 2

打开 Asset Generator,在模型下拉里选 GPT Image 2,在 text-to-imageedit 之间选模式,设置尺寸、设置质量、写提示词。编辑模式下,同时附上 1–3 张参考图。默认质量是 高(high);文生图默认尺寸是 landscape_4_3,编辑默认尺寸是 auto,会保留原图的画幅比例。

如果你在批量测试提示词,把质量下拉调成 低(low) 跑前几轮,再用 高(high) 重渲染胜出版本。免费试用已开放——注册 Teno 账户,从 GPT Image 2 最强的场景开始测:文字密集型产品视觉、本地化社交图卡、基于参考的精确编辑。

若想从工作室层面看 GPT Image 2 在另外 13 个图像与视频模型中的位置——包括完整 14 模型目录的决策矩阵和积分成本表——请看 Asset Generator 上线博客

参考资料