Nano Banana 2 Lite 發佈說明
Nano Banana 2 Lite 發佈說明
Google DeepMind 推出了 Nano Banana 2 Lite,這是 Gemini 系列中速度最快且最高效的圖像模型。該模型專為創作者、開發者和企業設計,在不犧牲 Nano Banana 系列核心控制力和準確性的情況下,優先考慮低延遲和降低成本。
核心能力與性能
Nano Banana 2 Lite 專為高速視覺探索和快速原型設計而打造。與較重的生產模型相比,它提供了顯著的延遲降低,從而實現更流暢的創意工作流程。
速度與成本效益
- 降低延遲: 該模型在圖像生成和編輯方面提供了極低的延遲,允許用戶在幾秒鐘內對視覺效果進行迭代。
- 成本效益: 它的設計旨在以較大模型一小部分的成本生成數千張圖像,使其在生產環境中進行擴展具有可行性。
- 性能基準: 根據用戶報告,生成時間每張圖像可能低於 5 秒,而基礎的 Nano Banana 2 模型約為 30 秒。
品質與控制
儘管被冠以 "Lite" 之名,該模型仍保留了 Nano Banana 系列的關鍵特性:
- 角色一致性: 該模型能夠在多張圖像中保持角色相似度。
- 精準編輯: 它支持詳細的視覺編輯,並利用現實世界的知識進行準確生成。
- 提示詞遵循度: 該模型針對詳細的提示詞進行了優化,為用戶提供對角色、場景和整體氛圍的更大控制力。
真實世界應用演示
DeepMind 展示了幾個原型,演示了 Nano Banana 2 Lite 如何實現即時生成式體驗:
- Space Lift: 一款室內設計應用程式,允許用戶根據上傳的圖像,立即重新構思各種風格的房間(例如,Mid-Century Modern、Bohemian Chic)。
- Gridscape: 一個用於學習的無限畫布,使用該模型生成資訊節點和圖像,以繪製出複雜的主題。
- Peek-A-Word: 一款互動式學習工具,可將選定的文本轉換為情境化的 AI 生成視覺效果和定義。
- Anywhere: 一款互動式 3D 地球儀,可在全球地標生成個性化明信片。
技術限制與安全性
雖然功能強大,但 Nano Banana 2 Lite 存在用戶應驗證的已知限制:
- 忠實度問題: 該模型在處理小臉部、文本中的準確拼寫和非常精細的細節方面可能會遇到困難。
- 事實準確性: 在生成資訊圖表或標註圖表時,它可能會誤解複雜數據。
- 在地化: 圖像內翻譯文本的語法和文化細微差別可能不完美。
- 複雜編輯: 多張圖像的高級混合或重大的光影變化(例如,從白天到黑夜)有時會產生不自然的效果。
安全性與浮水印
為了確保負責任的 AI 使用,所有使用 Nano Banana 2 Lite 創建的圖像都包含 SynthID,這是一種不可見的數位浮水印,可以識別圖像是否為 AI 生成。
社群洞察與用戶反饋
早期採用者和開發者分享了關於模型性能和定價的各種觀點:
"我看到每張圖像低於 5 秒,而基礎 NB2 約為 30 秒... 我很興奮能將其整合到我應用程式的引導流程中,因為我想讓用戶盡快體驗到驚喜時刻(aha moment)。"
"它的運作方式如廣告所述,且在某些元素方面表現得像一個蒸餾後的 Nano Banana 2,例如良好的文本渲染... 我的主要批評是,你無法透過程式碼強制設定 Nano Banana 2 Lite 的長寬比,但你可以透過 NB2 做到。
其他用戶指出,雖然速度是巨大的升級,但有些人認為定價(每張圖像 $0.034)比預期的高,考慮到生成時間的縮減。一些用戶也報告在嘗試並行生成多張圖像時遇到 RESOURCE_EXHAUSTED 錯誤。
可用性
Nano Banana 2 Lite 可以透過以下幾個 Google 平台使用:
- Gemini App: 可透過 Flash-Lite 模式使用。
- Google AI Studio: 用於快速原型設計和生產路徑。
- Gemini API: 用於開發者構建自定義應用程式。
- Gemini Enterprise Agent Platform: 用於擴展和管理 AI 代理。