Nano Banana

在 AI 图像生成领域发生了一些奇怪的事情。一个奇怪的名字 Nano Banana 开始在论坛、Discord 和 AI 测试网站上出现。

Nano Banana

在 AI 图像生成领域发生了一些奇怪的事情。一个奇怪的名字 Nano Banana 开始在论坛、Discord 和 AI 测试网站上出现。没有公告,也没有官方文档。只是一个模型开始超越其他所有图像生成器。

名字很奇怪。但性能却非常出色。

现在很多人认为这是 Google 在生成媒体方面的下一步重大举措,尽管他们尚未确认,但迹象无处不在。如果你关心 AI 艺术、编辑工具,或者只是想了解图像生成的未来方向,这很重要。

1、初次现身:LMArena 和香蕉热潮

Nano Banana 最初出现在一个名为 LMArena 的网站上,这是一个不同 AI 模型匿名竞争的“战斗模式”场所。

你输入一个提示,两个匿名模型会尝试生成最佳结果。但问题是:你不知道哪个是哪个。

随着时间的推移,用户开始注意到有一个模型与众不同。更好。它能保持面部一致。它理解上下文。它可以接受复杂的指令并真正遵循它们。很快,Reddit 线程和 Discord 服务器被猜测淹没:谁在背后?

然后人们注意到一个主题。提示中的香蕉图标。输出样本上的香蕉图片。甚至一些谷歌工程师在 X(前身为 Twitter)上开始发布香蕉表情符号,没有任何解释。

那就是 Nano Banana 这个名字开始流行起来。

2、它有什么不同?

这不仅仅是炒作。Nano Banana 做一些其他模型难以做到的事情,特别是在控制、一致性以及场景逻辑方面。以下是它所做的独特之处:

1. 通过语言进行编辑,而不是图层

你不需要 Photoshop 技能。你不需要绘制蒙版或进行任何修饰。只需用普通文本描述你想更改的内容,比如“删除背景并替换为森林”,或者“让她微笑并添加柔和的灯光”,它就会自己解决其余问题。

大多数其他模型要么弄乱细节,要么需要多次尝试。Nano Banana 往往第一次就能正确完成。

2. 真正有效的身份保留

问任何 AI 艺术家什么最破坏沉浸感,他们会说:“每次编辑时角色都在变化。”Nano Banana 似乎明白了这一点。你可以更换背景,改变角度,调整颜色,图像中的人物或物体保持不变。

这意味着可以创建一致的头像、漫画、网红形象、产品照片,而无需从头开始重建图像。

3. 快速,真的很快

虽然其他工具每张图像需要 10-15 秒,但 Nano Banana 通常在 1-2 秒内响应。有时甚至更快。感觉像是实时工作,而不是批量处理。

4. 多图像编辑和讲故事

你可以提供多个相关提示或图像,它会保持风格和叙事上的一致性。这是即使更知名的大模型仍然难以掌握的。这对于制作一致场景、UGC、漫画、广告活动或幻灯片的创作者来说非常有用。

3、但它真的是 Google 吗?

没有人正式承认。不是 Google,也不是 DeepMind。但有很多迹象表明是这样。

第二点: 一些与 Google 相关的开发者在社交媒体上发布了香蕉相关的引用。他们要么是在愚弄 AI 社区,要么是在暗示。

第三点: Nano Banana 太好了,不可能是车库团队的作品。性能,特别是角色一致性、场景意识和语言跟随方面,感觉像是来自前三实验室之一。目前能够达到这种质量水平的只有 OpenAI、Google,也许还有 Anthropic。但这不像是 Claude。它更像是带有画笔的 Gemini。

第一点: nanobanana.ai 网站上的界面具有 Gemini 已知输出的风格。该模型的行为类似于 Gemini 最近的多模态发布。这种做法,即低调发布,不打品牌,让社区自行发现,正好是 DeepMind 测试早期 LLM 的方式。

4、实际应用:人们用它做什么

这不仅仅是一个玩具。它已经改变了不同行业团队的工作流程:

  • 一家电子商务平台使用它来扩展不同颜色变体和风格的产品图像,大幅减少了摄影成本。他们报告称转化率提高了 34%
  • 内容团队在一个小时内构建了整个营销活动,这原本需要几天时间,因为模型不需要对每张图像进行三次润色。
  • 一家游戏公司使用它生成数千张 NPC 的人物肖像。总成本?不到 10,000 美元。传统流程?会超过 150,000 美元。
  • 一家建筑公司使用 Nano Banana 生成室内模拟图。足以跳过两轮客户修改。
  • 即使在教育领域,教师也使用它生成图表和科学视觉效果。学生反馈是“比教科书更清晰”。

这些都不是假设性的。这些数字是由在封闭测试或通过 Flux AI 和 LMArena 等非官方渠道测试该模型的团队报告的。

5、你可以在哪里尝试它

它不在 Hugging Face 上。不在 Colab 上。你找不到 GitHub 仓库。

但有一些方法可以尝试:

  1. LMArena 战斗模式:提交提示,并希望 Nano Banana 是一对一的匿名模型之一。不一定保证,但当你看到它的输出时,你会知道。
  2. nanobanana.ai:这是最接近正式前端的东西。上传图片,输入提示,获得编辑。并不总是稳定。有时网站会限制访问或下线。

Flux AI 或 FluxProWeb:这些平台有时会在公开之前获得前沿模型的访问权限。你可能会发现 Nano Banana 在后台运行。

Cursor IDE 插件:一些开发者声称通过从其前端中提取或代理 API,将 Nano Banana 编辑功能嵌入到设计工具中。

6、它并不完美

一些早期用户指出奇怪的行为,随机的扭曲,奇怪的光线,面部变形。其他人说这个模型有时会误解提示,尤其是模糊的提示。这是预期的。它还处于早期阶段。

此外:访问不可靠。网站会崩溃。模型有时会被替换或限制。这还不是商业产品,更像是一个你可以接触的泄露物。

7、为什么它重要

如果 Nano Banana 真的是 Google 的产物,那么它标志着一个转变。

不只是生成漂亮的图像。而是 取代整个编辑工作流程。不再需要切分蒙版。不再需要版本图层。不再需要批量渲染。只需告诉模型要做什么,就能快速得到结果。

这不是 Midjourney 的艺术版。它可能严重挑战 Photoshop、Canva 甚至 After Effects 等工具。AI 不只是生成,它还在 编辑保留风格化响应 人类指导。

8、结束语

Google 一直很安静。但香蕉们没有。无论 Nano Banana 是否成为完整产品,或者只是 Gemini 未来的测试案例,有一件事是明确的:

这东西不是为了玩乐而建造的。
它是为了工作而建造的。

原文链接:What is Google Nano Banana? Google’s Secret AI for Images

汇智网翻译整理,转载请标明出处