这个最新AI生图模型在人物一致性、细节保留和提示遵循上很强

大模型机器学习图像处理
这个最新AI生图模型在人物一致性、细节保留和提示遵循上很强

,

,

,

Nano-Banana 是一个最近在LMArena平台上出现的神秘AI图像生成和编辑模型,被广泛猜测是谷歌的新一代图像模型(可能与Gemini 3或Imagen 4相关),代号“nano-banana”暗示其体积小巧、适合设备端运行。 \x0a\x0a该模型以文本提示进行图像编辑为核心功能,表现出色于许多现有模型,如Flux Kontext和GPT-image-1,尤其在人物一致性、细节保留和提示遵循上。 它能处理复杂编辑,如旋转人物头部、合成场景、修复模糊照片或结合多张图像,而无需图层或工具,仅通过自然语言描述即可实现。\x0a\x0a多方认为这是谷歌为Pixel 10设备准备的本地图像编辑模型,“nano”表示其优化为轻量级,便于手机运行。 它可能基于谷歌的Imagen系列或Gemini模型演进,训练数据强调高质量和高一致性。\x0a\x0a实际体验,综合来看,我觉得比:flux-1-kontext-dev/pro、gpt-image-1、qwen-image-edit、seededit-3.0 强,不过qwen-image-edit、seededit-3.0这些在需要中文字符的场景中更合适。

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
大规模高性能计算集群优化实践
随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论