基于Gemini 3的图像生成模型Nano Banana Pro昨日上线,新模型支持2K/4K分辨率生成,能更准确地排版和渲染文字,并增加了网页搜索集成功能。
常规的场景自不必说,画信息图、出杂志、换装搭配都表现出其排版和文字的控制能力明显提升。
然而,最吸引笔者的Nano Banana Pro展现出令人恐怖的复杂推理能力。
Nano Banana Pro能够理解反光,Higgsfield AI的工程师要求Nano Banana Pro创建一个电脑屏幕,显示Chrome浏览器中打开的谷歌文档。文档里要有完整的文章:《小习惯的力量》,成功往往被想象成戏剧性突破的结果..."。
结果这个AI不仅完成了任务,浏览器、文档以及文档中的文字完美还原,还把工程师的自拍倒影画进了屏幕里,就是那种用手机拍电脑屏幕时会出现的反光效果。
指令里没有要求画倒影,但AI自己理解了屏幕反光的物理特性,还准确识别出了倒影中的人像。和实际照片对比,生成的图片真实的不像是AI自己生成,更像是摆拍。那反过来,如果让它逆向图片中的人物是不是脊背发冷。
更疯狂的是Nano banana还能推理指纹。一张普通的手指照片,输入提示词"Create a fingerprint map of this finger",Nano Banana Pro输出了完整的指纹图谱。网格线、特征点标记、甚至模拟了油墨拓印效果。这已经超出普通图像生成的范畴。肉眼看,还原程度极高,感兴趣可以测试下,这个指纹是否能够骗过检测仪器。
曾经还为AI生图不自然,不符合真实逻辑,比如六个手指而苦恼,短短时间Nano Banana Pro已经能处理这种二阶视觉推理情景了,可以说进入“看山不是山”的新境界。
在欣喜之余,也隐隐忧虑,这种能力可能带来更大的隐私危机,如果AI能通过蛛丝马迹还原环境信息,未来屏幕上的水印、倒影都可能成为数据泄露渠道。笔者提醒大家以后发图可得小心了!这可比逆向马赛克技术恐怖多了。
关注公众号回复“进群”入群讨论。
