谷歌发布图像生成编辑模型“纳米香蕉”
人民邮电报
本报讯 近日,谷歌在Google AI Studio正式发布Gemini 2.5 Flash Image图像模型,其曾用代号“nano banana(纳米香蕉)”,是谷歌目前最先进的图像生成与编辑模型。
据介绍,该模型在LMArena大模型竞技场的500多万场盲测中,收获超250万选票,以171分优势领先第二名,在图像编辑榜单上获得1362的高分,领先幅度近15%。其突出特点在于能将多张图像融合,保持高度角色一致性,利用自然语言实现有针对性的修改,并融入Gemini的世界知识。例如,可按指令将同一个角色置于不同环境,展示多角度画面,还能遵循视觉模板,完成模糊背景、去除污渍、改变姿势、上色等操作。
价格方面,该模型为每百万输出token收费30美元,每张图片约消耗1290个输出token,折合每张图片成本约0.039美元。目前,Gemini 2.5Flash Image已面向开发者和应用企业开放。 (潇栋)