这个最新AI生图模型在人物一致性、细节保留和提示遵循上很强

大模型机器学习图像处理

Nano-Banana 是一个最近在LMArena平台上出现的神秘AI图像生成和编辑模型，被广泛猜测是谷歌的新一代图像模型（可能与Gemini 3或Imagen 4相关），代号“nano-banana”暗示其体积小巧、适合设备端运行。 \x0a\x0a该模型以文本提示进行图像编辑为核心功能，表现出色于许多现有模型，如Flux Kontext和GPT-image-1，尤其在人物一致性、细节保留和提示遵循上。它能处理复杂编辑，如旋转人物头部、合成场景、修复模糊照片或结合多张图像，而无需图层或工具，仅通过自然语言描述即可实现。\x0a\x0a多方认为这是谷歌为Pixel 10设备准备的本地图像编辑模型，“nano”表示其优化为轻量级，便于手机运行。它可能基于谷歌的Imagen系列或Gemini模型演进，训练数据强调高质量和高一致性。\x0a\x0a实际体验，综合来看，我觉得比：flux-1-kontext-dev/pro、gpt-image-1、qwen-image-edit、seededit-3.0 强，不过qwen-image-edit、seededit-3.0这些在需要中文字符的场景中更合适。