Nano Banana Pro 中文/逻辑/写实全SOTA,国内可用 限时免费

大模型智能体验与创作图像处理

picture.image

「AI图像王者」Nano Banana Pro正式发布

最新一代的Nano Banana Pro 生成速度更快、原生2K更高清、推理能力增强,中文文本渲染效果和图像编辑控制能力增强,并实现了更精确的语义理解,相较于前代产品有显著升级。

picture.image

当初Nano Banana以极强的一致性和自然语言遵循能力革新了 AI 图像编辑,掀起了一阵热潮。

今天在群里看到群友“伪造”的微信聊天记录,着实精彩,发现新模型也“大有可玩”。

picture.image

同时恰好lovart.ai第一时间支持了Nano Banana Pro,而且 宣布:全员 三天免费用 。(国内可用!)

于是连夜上手实测,一图胜千言,一起看看,Nano Banana Pro的实力如何:

Lovart x Nano Banana Pro 启动!

picture.image

「 推理能力 」

首先最想分享给大家的是Nano Banana Pro推理能力的增强!

之前有看到过一个微积分解题的Case,我现场手写了一个,而且还是写在了正面盖过章的背景复杂的纸张:

picture.image


              
 

  `求解这个积分,并把解题过程还写在这张纸上`
 
              
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
              
 
 
 
 
 
 
 
 
 
 
 

picture.image

生成的图,无论是背景还是纸面都保持的很好,而且题做的还是对的, 这就意味着模型不仅仅是根据词匹配元素,而是真正的理解图像并且有推理能力,然后把他用图片呈现出来。

这也意味着,这个模型就像是有着另一种层面的“视觉”能力,我们来试试让他找不同:

picture.image

  

               
                
                  
                
                找不同,在原图的基础上圈出上下两图不一样的地方
               
               
                
                 
                  
                   
                    
                     
                      
                     
                    
                    
                   
                  
                 
                 
                  
                   
                    
                     
                      
                     
                    
                    
                   
                  
                 
                
               

picture.image

虽然没有 完全的找对,但是从圆圈和标注中看出来,Nano Banana Pro不是在瞎画,而是真的在对比和推理生成的图片。可以感受到它有了更强的推理能力、世界知识和信息。

大家看完这两个Case,是否有一种感受, 语言模型和图像模型的边界正在逐渐模糊,大一统模型是势不可挡的趋势。

「 提示词遵循 」

这款模型还有极强的提示词遵循能力,以下提示词要求极其严苛细致,但是生成的图像几乎全部遵循,而且生成的中文字体还十分稳定:

这是一个较长长的提示词,大家可以滑动查看:

  
【总体要求】 画面类型:高中物理教学插图,示意图,简洁专业风格 整体布局:横向构图,A4纸横向,分为左中右三部分,视觉重心在中部 画风要求: 线条清晰,黑白灰为主,适当点缀少量颜色(蓝、红、绿)用于强调物理量。 类似教科书插图风格,避免花哨装饰,强调物理概念的准确表达。 整体感觉科学、直观,便于学生理解。 【左侧区域】—— 物理场景与基本概念(约左侧1/4区域) 背景:浅灰色背景,与中部和右侧白色区域有明显区分。 左上角标注文字:"万有引力基本概念"(黑色,加粗,8号字)。 主要元素: 地球: 位于左侧区域中央,圆形,黑色实线边框,浅蓝色填充。 标注地球质量 M(黑色,7号字)。 标注地球半径 R(黑色,6号字)。 地球中心标注"O"(黑色,6号字)。 地表物体: 在地球表面绘制一个小物体(小方块,黑色边框,白色填充)。 从物体指向地心的绿色箭头表示重力 mg。 标注文字:"mg"(绿色,7号字)。 引力公式框: 一个方框,黑色细边框,白色填充。 内部文字: "万有引力定律"9号字,加粗) "F = GMm/r²"(红色,8号字) "G = 6.67×10⁻¹¹ N·m²/kg²"(黑色,6号字)   
【中部区域】—— 卫星轨道与受力分析(约中间1/2区域) 背景:白色背景,凸显轨道和矢量图。 上方标注文字:"卫星轨道运动分析"(黑色,加粗,8号字)。 主要元素: 地球: 位于中部区域中心,圆形,黑色实线边框,浅蓝色填充。 比左侧区域的地球稍大。 标注地球中心"O"(黑色,6号字)。 圆形轨道: 以地球中心为圆心,绘制一个黑色虚线圆形轨道。 轨道半径标注为 r(蓝色,7号字)。 从地心到轨道的蓝色虚线箭头表示轨道半径。 卫星位置1(顶部): 在轨道顶部绘制卫星:小圆形,黑色边框,白色填充。 标注"卫星""m"(黑色,6号字)。 万有引力:从卫星指向地心的绿色粗箭头,标注"F"(绿色,7号字)。 向心加速度:与万有引力同向的红色虚线箭头,标注"a"(红色,6号字)。 线速度:沿轨道切线方向(水平向右)的红色粗箭头,标注"v"(红色,7号字)。 卫星位置2(右侧): 在轨道右侧绘制另一个卫星位置。 万有引力:从卫星指向地心的绿色粗箭头。 线速度:沿轨道切线方向(竖直向下)的红色粗箭头,标注"v"。 角速度示意: 在轨道上用弧形箭头表示角速度方向(逆时针)。 标注"ω"(红色,6号字)。 周期示意: 用虚线标注卫星绕行一圈,标注"T"(蓝色,7号字)。 【右侧区域】—— 运动规律与公式(约右侧1/4区域) 背景:浅灰色背景,与中部白色区域区分。 右上角标注文字:"卫星运动规律"(黑色,加粗,8号字)。 主要元素: 核心方程框: 一个方框,黑色细边框,白色填充。 内部文字: "向心力 = 万有引力"9号字) "mv²/r = GMm/r²"(红色,8号字) 线速度公式框: 另一个方框,黑色细边框,白色填充。 内部文字: "线速度"9号字) "v = √(GM/r)"(红色,8号字) "r↑ → v↓"(蓝色,7号字) 角速度公式框: 另一个方框,黑色细边框,白色填充。 内部文字: "角速度"9号字) "ω = √(GM/r³)"(红色,8号字) "r↑ → ω↓"(蓝色,7号字) 周期公式框: 另一个方框,黑色细边框,白色填充。 内部文字: "周期"9号字) "T = 2π√(r³/GM)"(红色,8号字) "r↑ → T↑"(蓝色,7号字)   
【底部】—— 图例与标题 图例(左下角): 白色半透明框,灰色细边框。 内容: ━━ 轨道/坐标轴(黑色,7号字) ⇥ 速度矢量(红色,7号字) — — 半径/距离(蓝色,7号字) ⇥ 引力(绿色,7号字) ● 卫星/天体(黑色,7号字) 标题(底部居中): 位置:画面最底部,水平居中。 文字:"图1 万有引力与卫星圆周运动示意图" 字体:黑体或粗体Arial,11号,加粗显示。 【整体色彩方案】 背景色:左右两层浅灰色 (F8F8F8),中层白色 (FFFFFF)。 强调色: 速度相关矢量:D32F2F(深红色) 位移/距离相关:1976D2(蓝色) 引力/重力:4CAF50(绿色) 地球填充:B3E5FC(浅蓝色) 常规线条/文字:000000(黑色) 辅助线条/背景:757575(灰色) 线条粗细: 主线条/矢量:0.8pt 虚线/轨道:0.6pt 细辅助线:0.4pt

picture.image

下边的这个示例是我们曾经为客户定制开发的一个绘本案例,要严格的遵循提示词才能通过,我们尝试了一下,遵循程度真的极其出色:

  

               
                
                  
                  
                
                小熊从家里窗户看到室外,窗外大树枝芽发绿,两只小鸟在树上鸟窝里唱歌,另一只小鸟从树下往树上飞。五颜六色的蝴蝶飞着。 背景是蓝天,门口是绿草地,开着红、黄、白、粉的小花。门边有一只黄色带红点的小皮球。儿童插画风格
               

picture.image

大家可以留心对比一下提示词中的要求和图片中的对照物,全部遵循,只是门的位置不太合适有些强行添加的意味。

下边的示例也是同样,模型遵循了全部的提示词要求,没有抽卡,一次直出,难得的稳定。

  

               
                
                  
                  
                
                小熊把滑板车放在大树旁边。 绿草坡上有一个大灌木丛,大灌木丛有个洞,5只刺猬还窝在一起睡觉。身上还披着红色、黄色的叶子。一只黑色小鸟在大灌木丛上看着刺猬。 另一只黄色小鸟在大灌木丛后面的小树上唱歌。 蓝天白云下,太阳在空中挂着。 小熊面向刺猬窝,一只手放在嘴边轻轻地向着刺猬说话。
               

picture.image

「 世界知识 」

既然有了推理能力,有了充足的世界知识,那么无论是用于教学、流程演示都不在话下:

  

               
                
                  
                
                物理课本的插画风格,体现光线的折射原理
               

picture.image

  

               
                
                  
                
                绘制 [手作珍珠奶茶] 的制作过程,设计精美,采用手绘插画风格,并且使用中文标记每个步骤,品牌落款是  鹿角巷 包含其品牌 logo,整体是适用于展示的手账设计。
               

picture.image

  
生成美妆教程讲解图,风格写实,要求:  
步骤划分:护肤→防晒→隔离→粉底→遮瑕→定妆→眉笔→眼影→眼线→睫毛膏→腮红→修容→口红(每步独立呈现,数量不限);  
场景:统一带美妆灯的化妆镜背景,摆放对应刷具 / 产品,人物动作贴合步骤(如眉笔勾勒、眼影晕染);  
视觉:配色自然清透,突出妆容质感,每步配简洁英文标题(如Brows/Eyeshadow),布局整洁不拥挤;  
适配:美妆教程配图,信息直观,新手易懂。

picture.image

  

               
                
                  
                
                创建一张宽版信息图,标题为“塑料瓶的奇妙旅程:从回收到新生”,采用现代、环保的扁平化设计风格。请包含以下元素:一个将塑料瓶放入回收箱的图标,一个回收厂分拣流水线的简化示意图,用箭头和编号展示“收集-分拣-清洁-再造”四个主要步骤的流程图,以及一个饼图,展示“回收塑料瓶的去向”(例如:45%制成衣物纤维,30%再造新瓶,15%用于包装,10%其他)。
               

picture.image

这四个Case由简到繁,但是模型无论是逻辑、知识、图像、文本都保持了相当高水准的输出。

「 系统模拟 」

在 X上比较火的还有直接生成系统页面的操作,基于纯文本生成电脑桌面+博主的主页,我尝试了两个系统的不同页面,Nano Banana Pro细节表现堪称疯狂。

  

               
                
                  
                
                生成一张搭载macOS Sonoma系统的iMac桌面截图。屏幕上打开着Adobe Photoshop和Figma两个应用窗口,窗口以分屏模式并排显示。Photoshop中是一张正在进行精修的时尚模特照片,而Figma中则是一个正在设计的移动端APP界面,界面风格是简约的。桌面背景是一张干净的浅灰色纯色图,Dock栏中整齐地排列着Sketch、Final Cut Pro等专业设计软件的图标。
               

picture.image

  

               
                
                  
                
                生成一张Windows 11操作系统的桌面截图,截图中已打开Google Chrome浏览器,并在浏览器窗口内展示youtube上正在播放马斯克的视频缩略图。
               

picture.image

就像是真实的屏幕截图一般,页面和视觉非常细节,尤其是第二张的Windows 11操作系统的桌面截图,图标、时间、页面非常真实。

「 中文文字稳定性 」

白板写字,白板上的擦痕和细节难分真假,后景中的电脑和桌面与略脏的白板擦呼应。

  

               
                
                  
                
                办公室内的白色白板,手写 "天天好心情" 文字,搭配白板擦与马克笔,背景含办公家具与设备,真实摄影风格。
               

picture.image

  

               
                
                  
                
                一幅古朴的宣纸长卷,其上用毛笔书写着苏轼的《前赤壁赋》全文。文本必须遵循传统格式,从右至左竖向排列,并展现出宋代文人书法的笔意,笔触遒劲,墨色浓淡相宜。写实,实拍
               

picture.image

  

               
                
                  
                
                根据以下古诗画一幅画,并附上原文。《将进酒》李白 君不见,黄河之水天上来,奔流到海不复回。君不见,高堂明镜悲白发,朝如青丝暮成雪。人生得意须尽欢,莫使金樽空对月。天生我材必有用,千金散尽还复来。烹羊宰牛且为乐,会须一饮三百杯。岑夫子,丹丘生,将进酒,杯莫停。与君歌一曲,请君为我倾耳听。钟鼓馔玉不足贵,但愿长醉不复醒。古来圣贤皆寂寞,惟有饮者留其名。陈王昔时宴平乐,斗酒十千恣欢谑。主人何为言少钱,径须沽取对君酌。五花马、千金裘,呼儿将出换美酒,与尔同销万古愁。
               

从上边两张图中可以看出,此模型对长文字的生成依然有着十分不错的表现和稳定性,这在前一段时间,甚至还是国产模型的唯一护城河,技术迭代真的太快了。

「 打破虚拟的真实感 」

同时,生成录制视频图也不在话下:

  

               
                
                  
                
                视频录制界面截图,含REC标识与时间戳,前景男性穿深色T恤,背景有人坐沙发看手机,室内客厅环境,真实录制质感。
               

picture.image

真实度,我们再加深一层:

  

               
                
                  
                
                监控视频回放界面截图,含标识与时间戳,前景男性穿深色T恤,背景有一位美女坐沙发看手机,室内客厅环境,昏暗,真实录制质感。
               

picture.image

以后的世界,有图也不一定有真相了。

「 主体一致性 」

我们再来看看人物的一致性保持:

  

               
                
                  
                
                一位 20 岁的东亚女性。拥有光滑、暖调白皙的皮肤,并在颧骨附近有一颗微小的美人痣。焦点清晰地对准她的眼睛,揭示出她深棕色虹膜中复杂的星芒状图案,以及柔光箱的清晰倒影。她的皮肤纹理自然而不完美,脸颊上有可见的毛孔和细小的微绒毛。她直视镜头,表情中性而宁静。来自左侧的柔和、漫射自然光,使用索尼 A7R IV 相机和 85mm f/1.4 镜头拍摄,浅景深,电影感纹理,RAW 照片风格。
               
               
                
                 
                  
                 
                 
                  
                 
                
               这个图的皮肤、眼神、头发的细节完全挑不出任何问题,虚与实之间,难分真假。
  

               
                
                  
                
                模拟手机照相效果,图中的人在喂猴子吃两根香蕉。手机实拍效果,确保画面生动真实。
               
               
                
                 
                  
                 
                
               

picture.image

多主体一致性,我拿我自己的照片传上去试了一下:

picture.image

  

               
                
                  
                
                两个人的合影,他们都穿着西服,在电影节
               

picture.image

我自己都有一丝恍惚,再来试试卡通IP:

picture.image

  

               
                
                  
                
                以上传的人物为主角,创作4格漫画
               

picture.image

这个精细度和光感,比上一代要更加的细腻。

在上一代模型中,对于儿童尤其是亚洲儿童,Nano Banana的表现还不太好,需要改变环境和神态时,时常生成的不像,但是最新一代有了明显进步:

picture.image

  

               
                
                  
                
                为图片中的人物 生成一整套写真,包含各种不同场景和不同服装,确保人物的一致性,5张图
               

picture.image

这一组是在Lovart的无边画布里5图同出的,这里不得不说,在多图场景下同时出图,素材堆叠的时候,Lovart的自由画布,是真的方便。

当我想使用别的图片作为上下文的时候,只需要选中需要的图片,直接输入生图提示词就可以了,非常的丝滑,不需要切换窗口也不需要反复的复制粘贴。

picture.image

  

               
                
                  
                
                用上传的图一为主角,创作一个和labubu一起面对困难,具有教育意义的条漫,使用中文,讲清楚不刷牙的危害,图文信息丰富。
               

picture.image

「 工作应用 」

打开思路,Nano Banana Pro也非常适合用来做PPT配图或者生成更加美观的图表,在Lovart里使用就更加方便了,想要什么风格,直接框选参考,想要修改还能直接编辑:

picture.image

  

               
                
                  
                
                请根据以下数据,参考图中的毛玻璃效果,生成一张清晰直观的饼图,展示2025年公司各产品线的销售额占比。图表标题:2025年各产品线销售额占比要求:使用不同的颜色区分各个扇区,并在每个扇区上标注产品名称和对应的百分比。图例放置在图表右侧。数据如下:| 产品线 | 销售额占比 ||---|---|| 智能手机 | 45% || 智能家居 | 25% || 笔记本电脑 | 20% || 配件及其他 | 10% |
               

picture.image

并且Lovart 的“ 可控改图能力 ”让 NanoBanana Pro 更强。如果点击“ 编辑元素

picture.image

你会神奇的发现,固定的图有了图层,甚至可以支持直接编辑文本修改。

这是Lovart团队刚刚上线了一项全新的黑科技:Layered Image Editing(分层图像编辑)它能自动识别一张图片中的不同元素,把它们拆分成独立图层。

picture.image

小范围替换、细节修图、换物体、换材质、改字都非常稳。

有了这个功能,我们对图片像创作,尤其是用于工作业务中的图像创作的可控性就大大提高了, 效率远超“重新生成”的抽卡!

picture.image

其次,Lovart的无边画布在大型图、复杂图、组合图的时候,操作更加方便和丝滑,这也是我们业务场景中经常会遇到的,比如网页原型图的设计,在多图上传和生成的时候,Lovart直接画布拖入比单一窗口要好用太多了。

picture.image

  

                 
                  
                    
                    
                  
                  这是一个文旅AI打卡机的操作界面UI,我对他的位置和内容都做了标注和样式的放置请你帮我对以上五个界面的UI进行重新的设计和优化以上只是我给的低保真线框图请你沿用当前的颜色风格,对页面中的细节进行调整,保证布局位置一致 把页面中的线框简单文本改成更符合页面风格的艺术字体请对整个UI画面进行整体的设计,体现出高级感科技感 同时又有旅行的温馨设计中的人物示意图 参考当前页面中的人物示意图即可
                 
               
                
               

批量生成一批,然后挑选UI的风格,确认后再交由专业设计师完成细节,真的能够省掉非常多的沟通时间。

「 最后 」

测完这一圈,我的感受是:Nano Banana Pro已经够强,推理、物理、中文渲染毋庸置疑都已是SOTA级别的模型。

推荐大家自己去体验下,国内直连目前在Lovart.ai使用是最方便的。

地址在此:www.lovart.ai

所以,Lovart.ai新模型上线的羊毛,务必薅住。一共两个活动:

1. Banana 免费周 (11.21–11.23)

就是现在! Nano Banana Pro 全员免费! 国内直连,登录直接使用 ,没有任何门槛,大家可以趁这几天把想画的图统统画一遍。

2. 订阅送365天畅享 (11.21–11.30)

在活动期间订阅 Basic 及以上会员(老会员同享!),直接送365 天的 Nano Banana Pro 0 积分无限量使用权!同步覆盖 NB1、Seedream 4 甚至 MJ v7。相当于开一个会员,未来一整年里的顶尖图像模型都包圆了。

Lovart的无边画布打破了对话框的限制,分层编辑解决了 AI 抽卡的随机性。这让这些模型能够在你手中变得更加“好用”。如果你是设计师或者图像模型的重度使用者,这个配置绝对是目前的版本答案。

趁着这三天全员免费,强烈建议大家把手里积压的想法统统跑一遍,亲手感受一下SOTA模型的爽感,好用的工具自己会说话。

最后,工具再强,终究还是要看用它的人。非常期待大家能用 Nano Banana Pro 跑出惊艳的“神图”,欢迎小伙伴们在评论区交流用法。

我是梦飞,我们下次见~

往期推荐

K2 Thinking可能才是Agent的真正起点

国内首个视觉 Agentic 编程模型来了!

强主体弱镜头Seedance 1.0 Pro首尾帧测评

开了个盲盒,五大主流云Redis实测

30分钟手把手从0训练一个ChatGPT模型

阿里Qoder CLI发布,AI编程走向“全程接管”

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎大规模机器学习平台架构设计与应用实践
围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等AI工程化实践,全面分享如何以开发者的极致体验为核心,进行机器学习平台的设计与实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论