Google圖像編輯人工智慧(AI)工具Nano Banana曾在社群上掀起3D公仔圖生成熱潮,Google今(21)日推出Nano Banana Pro影像模型,以Gemini 3 Pro為基礎,可以在圖像中直接生成多種語言且精準、清晰的文字。
Google新影像模型「Nano BananaPro」可多語言文字。(圖/翻攝自Google)Google在官方部落格發文說明,Nano Banana Pro結合先進的推理能力與世界知識,不僅能生成精準的資訊圖表與清晰文字,更提供專業級的設計一致性與光影控制,協助使用者將腦中的創意具象化。
舉例來說,透過Nano Banana Pro可以獲得準確的教育性解說圖來學習新主題,還能連結Google搜尋龐大的知識庫,協助用戶快速製作食譜摘要,或將天氣、體育賽事等即時資訊視覺化。
Google指出,Nano Banana Pro是目前在圖像中直接呈現正確渲染且清晰文字的最佳模型。可以在產品打樣或海報中創建細節更豐富的文字,並運用更多樣化的紋理、字體和書寫風格;透過Gemini強化的多語言推理能力,用戶可以生成多種語言的文字,或將內容在地化與翻譯,以便擴展國際市場或更輕鬆與親朋好友分享內容。
透過Nano Banana Pro改進的局部編輯功能,用戶可以選擇、微調和轉換圖像的任何部分,調整相機角度、改變焦點並應用細緻的調色,甚至轉換場景光線,例如將白天變為黑夜或創造散景效果。
Nano Banana Pro將在全球的Gemini應用程式中陸續推出,只需在選擇Thinking模型時使用「生成影像」功能即可。免費版用戶將獲得有限的免費額度,用完後將恢復使用原本的Nano Banana模型。Google AI Plus、Pro和Ultra訂閱者,將享有更高的額度。
針對Google搜尋中的AI模式,Nano Banana Pro目前在美國開放給Google AI Pro和Ultra訂閱者使用。