MODEL-ZOO

Nano Banana

在 AI 图像生成领域发生了一些奇怪的事情。一个奇怪的名字 Nano Banana 开始在论坛、Discord 和 AI 测试网站上出现。

admin

Aug 25, 2025 • 7 min read

在 AI 图像生成领域发生了一些奇怪的事情。一个奇怪的名字 Nano Banana 开始在论坛、Discord 和 AI 测试网站上出现。没有公告，也没有官方文档。只是一个模型开始超越其他所有图像生成器。

名字很奇怪。但性能却非常出色。

现在很多人认为这是 Google 在生成媒体方面的下一步重大举措，尽管他们尚未确认，但迹象无处不在。如果你关心 AI 艺术、编辑工具，或者只是想了解图像生成的未来方向，这很重要。

1、初次现身：LMArena 和香蕉热潮

Nano Banana 最初出现在一个名为 LMArena 的网站上，这是一个不同 AI 模型匿名竞争的“战斗模式”场所。

你输入一个提示，两个匿名模型会尝试生成最佳结果。但问题是：你不知道哪个是哪个。

随着时间的推移，用户开始注意到有一个模型与众不同。更好。它能保持面部一致。它理解上下文。它可以接受复杂的指令并真正遵循它们。很快，Reddit 线程和 Discord 服务器被猜测淹没：谁在背后？

然后人们注意到一个主题。提示中的香蕉图标。输出样本上的香蕉图片。甚至一些谷歌工程师在 X（前身为 Twitter）上开始发布香蕉表情符号，没有任何解释。

那就是 Nano Banana 这个名字开始流行起来。

2、它有什么不同？

这不仅仅是炒作。Nano Banana 做一些其他模型难以做到的事情，特别是在控制、一致性以及场景逻辑方面。以下是它所做的独特之处：

1. 通过语言进行编辑，而不是图层

你不需要 Photoshop 技能。你不需要绘制蒙版或进行任何修饰。只需用普通文本描述你想更改的内容，比如“删除背景并替换为森林”，或者“让她微笑并添加柔和的灯光”，它就会自己解决其余问题。

大多数其他模型要么弄乱细节，要么需要多次尝试。Nano Banana 往往第一次就能正确完成。

2. 真正有效的身份保留

问任何 AI 艺术家什么最破坏沉浸感，他们会说：“每次编辑时角色都在变化。”Nano Banana 似乎明白了这一点。你可以更换背景，改变角度，调整颜色，图像中的人物或物体保持不变。

这意味着可以创建一致的头像、漫画、网红形象、产品照片，而无需从头开始重建图像。

3. 快速，真的很快

虽然其他工具每张图像需要 10-15 秒，但 Nano Banana 通常在 1-2 秒内响应。有时甚至更快。感觉像是实时工作，而不是批量处理。

4. 多图像编辑和讲故事

你可以提供多个相关提示或图像，它会保持风格和叙事上的一致性。这是即使更知名的大模型仍然难以掌握的。这对于制作一致场景、UGC、漫画、广告活动或幻灯片的创作者来说非常有用。

3、但它真的是 Google 吗？

没有人正式承认。不是 Google，也不是 DeepMind。但有很多迹象表明是这样。

第二点： 一些与 Google 相关的开发者在社交媒体上发布了香蕉相关的引用。他们要么是在愚弄 AI 社区，要么是在暗示。

第三点： Nano Banana 太好了，不可能是车库团队的作品。性能，特别是角色一致性、场景意识和语言跟随方面，感觉像是来自前三实验室之一。目前能够达到这种质量水平的只有 OpenAI、Google，也许还有 Anthropic。但这不像是 Claude。它更像是带有画笔的 Gemini。

第一点： nanobanana.ai 网站上的界面具有 Gemini 已知输出的风格。该模型的行为类似于 Gemini 最近的多模态发布。这种做法，即低调发布，不打品牌，让社区自行发现，正好是 DeepMind 测试早期 LLM 的方式。

4、实际应用：人们用它做什么

这不仅仅是一个玩具。它已经改变了不同行业团队的工作流程：

一家电子商务平台使用它来扩展不同颜色变体和风格的产品图像，大幅减少了摄影成本。他们报告称转化率提高了 34%。
内容团队在一个小时内构建了整个营销活动，这原本需要几天时间，因为模型不需要对每张图像进行三次润色。
一家游戏公司使用它生成数千张 NPC 的人物肖像。总成本？不到 10,000 美元。传统流程？会超过 150,000 美元。
一家建筑公司使用 Nano Banana 生成室内模拟图。足以跳过两轮客户修改。
即使在教育领域，教师也使用它生成图表和科学视觉效果。学生反馈是“比教科书更清晰”。

这些都不是假设性的。这些数字是由在封闭测试或通过 Flux AI 和 LMArena 等非官方渠道测试该模型的团队报告的。

5、你可以在哪里尝试它

它不在 Hugging Face 上。不在 Colab 上。你找不到 GitHub 仓库。

但有一些方法可以尝试：

LMArena 战斗模式：提交提示，并希望 Nano Banana 是一对一的匿名模型之一。不一定保证，但当你看到它的输出时，你会知道。
nanobanana.ai：这是最接近正式前端的东西。上传图片，输入提示，获得编辑。并不总是稳定。有时网站会限制访问或下线。

Flux AI 或 FluxProWeb：这些平台有时会在公开之前获得前沿模型的访问权限。你可能会发现 Nano Banana 在后台运行。

Cursor IDE 插件：一些开发者声称通过从其前端中提取或代理 API，将 Nano Banana 编辑功能嵌入到设计工具中。

6、它并不完美

一些早期用户指出奇怪的行为，随机的扭曲，奇怪的光线，面部变形。其他人说这个模型有时会误解提示，尤其是模糊的提示。这是预期的。它还处于早期阶段。

此外：访问不可靠。网站会崩溃。模型有时会被替换或限制。这还不是商业产品，更像是一个你可以接触的泄露物。

7、为什么它重要

如果 Nano Banana 真的是 Google 的产物，那么它标志着一个转变。

不只是生成漂亮的图像。而是 取代整个编辑工作流程。不再需要切分蒙版。不再需要版本图层。不再需要批量渲染。只需告诉模型要做什么，就能快速得到结果。

这不是 Midjourney 的艺术版。它可能严重挑战 Photoshop、Canva 甚至 After Effects 等工具。AI 不只是生成，它还在编辑、保留、风格化 和响应人类指导。

8、结束语

Google 一直很安静。但香蕉们没有。无论 Nano Banana 是否成为完整产品，或者只是 Gemini 未来的测试案例，有一件事是明确的：

这东西不是为了玩乐而建造的。
它是为了工作而建造的。

原文链接：What is Google Nano Banana? Google’s Secret AI for Images

汇智网翻译整理，转载请标明出处