Google测试神秘图像AI模型Nano Banana:突破性进展
Google目前正在LMArena测试一款代号为“Nano Banana”的神秘图像AI模型,其表现令人瞩目。
Nano Banana的神秘起源
Nano Banana最初在LMArena的竞技平台上浮现。LMArena是一个AI模型匿名对决的擂台,用户输入相同的提示词后,由两个未知模型生成图像,用户无法得知结果出自哪个模型。这种匿名基准测试模式,与Google DeepMind早期测试大型语言模型(LLM)的方法如出一辙。
随着测试的深入,用户逐渐察觉到其中一个匿名模型异军突起。它在生成结果方面表现更为卓越:不仅能保持面部表情的高度一致性,精确理解上下文,还能接收并完美执行复杂的指令。随后,一些线索开始浮出水面:提示词中不时出现香蕉图标,输出图像中也可见香蕉元素,甚至Google的工程师们也在社交平台X上不约而同地发布香蕉表情符号,种种迹象都指向了Nano Banana。
卓越的图像生成能力
Nano Banana在多项关键能力上超越了现有模型,尤其在图像操控、跨帧一致性和场景逻辑方面表现出色。用户只需通过纯文本描述所需修改,Nano Banana便能自动完成:无论是调整背景、改变视角,还是调整色彩,图像中的主体人物或物体都能保持高度的稳定与不变。
更令人惊叹的是其处理速度。与许多AI工具动辄10-15秒的响应时间相比,Nano Banana通常只需1-2秒,有时甚至更快,几乎达到实时操作的水平。
现状与展望
尽管其强大性能已引人关注,Google尚未正式发布Nano Banana。目前,用户可以在LMArena平台或相关网站上体验该模型,但其稳定性仍有待提升,偶尔会出现速度限制提示或离线状况。