Nano Banana Lab：從 Prompt 到 App，用 Google AI Studio 快速實現你的想法

AI first 的工作流「想法→應用」: 如何持續測試、修改、發布的實戰案例。這篇也是針對之前 DevFest Taipei Workshop 我一直很想帶著參與者一起做完的部分，一次搞定它。

JimmyLiao(NET)

Dec 16, 2025

1. AI First 開發之於傳統軟體開發的影響

傳統開發 vs AI Fist 驅動開發

傳統開發流程：

構思想法 → 2. 學習框架 → 3. 環境設定 → 4. 撰寫程式碼 → 5. 除錯 → 6. 部署

時間成本：往往需要好幾個工作日，甚至是需要與多個職能負責人溝通
技術門檻：需要深厚的程式設計經驗
迭代速度：每次修改都需要完整的開發週期 (ex. 排入 Backlog, PRD review etc.)

AI First 開發：

描述想法（Prompt）→ 2. AI 生成完整應用 → 3. 測試 → 4. 對話式修改 → 5. 重新部署

時間成本：數小時 (這次我大概只花了 1-1.5 小時)
技術門檻：會寫 Prompt 就能開發
迭代速度：對話即修改，即時看到結果

本文展示了什麼

這篇文章記錄了 **Nano Banana Lab** 的完整開發過程，一個用 Google AI Studio 從零到部署的 IP 角色生成應用。更重要的是，展示了：

✅ **如何用 Prompt 快速將想法轉化為可運行的應用**

✅ **如何透過對話持續測試、修改、發布**

✅ **如何讓開發者與 Builder 快速實踐創意**

*圖 1：Nano Banana Lab 的圖像編輯介面 — 從想法到這個應用，只花了1小時*

Nano Banana Lab 是什麼

一個為 IP 角色「Jimmy」設計的多模態內容生成工具，提供：

**DNA 模式**：文生圖，基於「Visual DNA」生成一致性角色
**編輯模式**：圖生圖，AI 輔助圖像編輯
**Veo 模式**：圖生影片，將靜態圖像轉換為短影片

關鍵：

No-Build 架構（無需 npm、webpack）
BYOK 安全機制（Bring Your Own Key）
完整的存取控制（Passcode + Idle Timeout）

重要的是：這個應用完全由 AI Studio 對話生成，並在持續對話中完成 4 次功能修改。

2. 成果展示：先看看我們做出了什麼

在深入開發過程之前，先看看最終成果，讓您了解這個應用的實際效果。

應用功能概覽

Nano Banana Lab 整合了三個核心功能，提供完整的 IP 角色內容生成工作流：

1. **DNA 模式**：快速生成一致性角色圖像

2. **編輯模式**：精細調整圖像細節

3. **Veo 模式**：將靜態圖像轉換為動態影片

Demo 影片

完整工作流程演示

**Veo 影片生成演示**

此影片展示：

- 上傳 Jimmy 角色圖像

- 輸入動畫提示詞（「跳個 Rat Dance」）

- 等待 Veo 生成 5 秒短影片

- 播放與下載生成的影片

實際生成範例

**Jimmy 角色的 Visual DNA 生成結果**

基於相同的 Visual DNA Prompt，模型能夠生成具有一致視覺特徵的角色圖像：

結果：角色主體特徵保持不變，成功轉換為影片。

**影片生成示例**

動畫提示詞：「跳個 Rat Dance」

結果：Jimmy 角色以 Pixar 風格執行跳舞動作，保持視覺一致性，動作流暢自然。

---

3. AI First (with AI Studio) 驅動的開發工作流

核心循環：Prompt → Code → Test → Deploy → Iterate

這是 Nano Banana Lab 的完整開發流程，展示如何透過 AI Studio 實現快速迭代：

┌─────────────────────────────────────────────────────┐
│                    開發循環                          │
│                                                     │
│  1. Prompt（描述想法）                                │
│         ↓                                           │
│  2. AI 生成程式碼                                    │
│         ↓                                           │
│  3. 測試（發現問題）                                  │
│         ↓                                           │
│  4. 對話式修改（提出需求）                             │
│         ↓                                           │
│  5. AI 修正程式碼                                    │
│         ↓                                           │
│  6. 部署（Cloud Run / 本地）                          │
│         ↓                                           │
│  回到步驟 3（持續迭代）                                │
└─────────────────────────────────────────────────────┘

第 1 輪：初始 Prompt → 完整應用

**使用者的初始想法**（用自然語言描述）：

我是直接先用 Gemini Web App (https://gemini.google.com) 先討論:

> IP 視覺DNA的編碼術：使用Nano Banana 鑄造一致性角色的應用代理

> 翻譯成英文，我打算放到 google ai studio 的 prompt 產生看看, 然後預計先有一個範例 (故事性), 產出人物圖片, 在接續產生影片.

> 提供 prompt 讓我之後方便打造 app, 不是幫我直接產圖。

**Gemini 的回應與理解**：

好的，非常抱歉！我理解您的意思了。您需要的是一個結構化的、可以重複使用的 Prompt 範本，以便在 Google AI Studio 中鑄造出名為 Jimmy 的一致性 IP 角色，並能將這個 **視覺 DNA** 應用於圖片和影片生成。

*圖 1-2：Gemini 生成的 Jimmy IP 視覺 DNA 鑄造 Prompt 範本（第一部分）*

**Jimmy 的 Visual DNA 核心設定**：

- **CHARACTER NAME**: Jimmy

- **AESTHETIC STYLE**: High-detail 2D/3D hybrid rendering (Pixar meets Sci-Fi)

- **VISUAL DNA KEY TRAITS**:

1. **Hair**: Bright, spiky purple hair (Magenta/Violet tone)

2. **Signature Item**: Yellow banana headband with solar panel

3. **Outfit**: High-tech explorer jumpsuit (safety orange and neon green)

4. **Companion**: Pee-Wee（黃色香蕉機器人夥伴）

5. **Expression/Vibe**: Energetic, curious, determined

*圖 1-3：Prompt 範本包含靜態圖片與動態影片的生成範例*

**Prompt 範本的應用場景**：

1. **靜態圖片生成範例（故事性應用）**:

- TASK: Generate a full-body, high-resolution static image of Jimmy

- SCENE CONTEXT: Jimmy 在外星叢林中，站在巨大的機器人雕像頭上

- CAMERA/LIGHTING: Wide shot, 強調霓虹光效

2. **動態影片生成準備（動作一致性）**:

- TASK: Describe a 5-second action sequence

- ACTION/MOTION SEQUENCE: Jimmy 從機器人頭上跳躍至蘑菇帽

- 確保 Jimmy 的視覺一致性在整個動作中保持

*圖 1-4：Gemini 說明如何在開發 App 時使用這個 Visual DNA Prompt 範本*

**如何使用這個範本**：

- 在開發 App 時，可以將「**核心 IP 視覺 DNA 設定**」作為固定的參數模組

- 當使用者選擇生成圖片或影片時，只需修改「應用 1」或「應用 2」中的 **SCENE/TASK 內容**

- 這樣無論場景如何變化，AI 都會被追迫遵守 Jimmy 的核心視覺特徵（頭髮、香蕉頭帶、制服等），從而實現視覺一致性

**從 Visual DNA 到完整應用**：

有了這個 Prompt 範本後，下一步就是將它整合到應用中。我將這個範本帶到 **Google AI Studio**，並用它來生成完整的 React 應用程式。

- 打開 AI Studio 選取這個範本:

- 貼上剛剛透過 Gemini Web App 產生的 Prompt

**AI Studio 的回應**：

模型理解需求之後，產生一下檔案:

- `index.html`：包含 Import Maps 的入口檔案

- `App.tsx`：主應用邏輯（狀態管理、路由）

- `components/CharacterGenerator.tsx`：DNA 生成組件

- `components/ImageEditor.tsx`：圖像編輯組件

- `components/VideoGenerator.tsx`：Veo 影片生成組件

- `services/geminiService.ts`：所有 AI API 呼叫邏輯

**關鍵亮點**：

- ✅ Visual DNA 成為應用的核心參數

- ✅ 零安裝，直接可運行（No-Build）

- ✅ 完整的組件架構

- ✅ 預填的 Jimmy Visual DNA Prompt

*圖 1-5：AI Studio 的 Code Assistant 自動分析應用架構*

**一鍵部署到 Cloud Run**：

AI Studio 最強大的功能之一，就是生成完應用後，可以直接點擊「**Deploy app**」按鈕，一鍵部署到 Google Cloud Run：

*圖 1-6：AI Studio 介面中的「Deploy app」按鈕，支援一鍵部署至 Cloud Run*

點擊後，AI Studio 會自動：

📦 打包應用程式碼
🚀 部署至 Google Cloud Run
🔗 生成可公開訪問的 URL

*圖 1-7：部署成功通知，顯示應用已上線並提供 Cloud Run URL*

**時間成本**：約 30 分鐘（Gemini 對話 + AI Studio 生成 + 一鍵部署 + 初步測試）

這就是 AI First 開發的核心優勢：**從想法到可運行的應用程式，全程透過對話完成，無需手動配置伺服器或容器化流程**。

第 2 輪：測試發現問題 → 對話式修正

**測試階段發現的問題**：

使用者部署應用後測試，發現：

“為何其他使用者沒有輸入 API Key 也可以產圖、修圖、產影片？！”

**對話式修改**：

使用者直接在 AI Studio 中描述問題：

User: “passcode works! but...為何其他使用者沒有輸入 API key 也可以產圖, 修圖, 產影片？”

Gemini: “偵測到安全性問題！App.tsx 中自動讀取 process.env.API_KEY。

        解決方案：實作 BYOK (Bring Your Own Key) 機制...”

**AI 自動修正**：

Gemini 分析問題後，提供完整的修正方案：

1. **移除環境變數自動讀取**

// App.tsx

- const apiKey = process.env.API_KEY || “”;

+ const apiKey = localStorage.getItem(”gemini_api_key”) || “”;

2. **新增 ApiKeyInput Modal**

if (!apiKey) {

return <ApiKeyInput onSubmit={handleApiKeySubmit} />;

}

3. **更新 geminiService.ts**

// 強制使用者提供的 Key

const genAI = new GoogleGenerativeAI(userProvidedKey);

第 3 輪：功能需求變更 → 即時迭代

**新需求**：

使用者測試後提出新的安全需求：

“頁面重整時，或是頁面 idle 超過 5 mins，也要重新輸入 passcode”

**對話式開發**：

User: “頁面重整時, 或是頁面 idle 超過 5 mins, 也要重新輸入 passcode”

Gemini: “了解！需要兩個修改：

        1. 移除 sessionStorage 持久化

        2. 新增閒置計時器監聽 mousemove/keydown...”

**AI 生成的解決方案**：

1. **移除 Session Persistence**

- const [isUnlocked, setIsUnlocked] = useState(

-   sessionStorage.getItem(”unlocked”) === “true”

- );

+ const [isUnlocked, setIsUnlocked] = useState(false);

2. **新增 Idle Timeout 邏輯**

useEffect(() => {

if (isUnlocked) {

const timer = setTimeout(() => {

setIsUnlocked(false);

alert(”已閒置 5 分鐘，應用已鎖定”);

    }, 5 * 60 * 1000);

const resetTimer = () => { /* 重置邏輯 */ };

window.addEventListener(”mousemove”, resetTimer);

window.addEventListener(”keydown”, resetTimer);

return () => { /* 清理邏輯 */ };

  }

}, [isUnlocked]);

**成果**：

- ✅ 頁面刷新後需重新驗證

- ✅ 5 分鐘無操作自動鎖定

- ✅ 多層安全防護

第 4 輪：模型調整 → 一句話搞定

原因: veo 3.1 的 Token per min 蠻少，猶豫是否要改成 veo 3.0 or 2.0

**需求**：

“veo-3.1-fast-generate-preview 改成 veo-3.0-fast-generate-001，但是 veo-3.1 可以先註解掉”

**AI 的回應**：

Gemini: “明白！切換到穩定版本。修改 geminiService.ts：...”

**程式碼變更**：

// services/geminiService.ts

- const VIDEO_MODEL = “veo-3.1-fast-generate-preview”;

+ const VIDEO_MODEL = “veo-3.0-fast-generate-001”;

+ // 備用版本：veo-3.1-fast-generate-preview

**成果**：

- ✅ 切換至穩定版本

- ✅ 保留備用註解

- ✅ API 相容性提升

**時間成本**：約 5 分鐘（一句話 + AI 修改）

Master Prompt：將經驗固化為可重複流程

經過 4 輪迭代後，我們將所有需求、修正、最佳實踐整合成一個 **Master Prompt**。

任何人都可以用這個 Prompt 在 AI Studio 中**一次性生成完整的應用**，包含：

- ✅ 所有功能（DNA、編輯、Veo）

- ✅ 所有安全機制（BYOK、Passcode、Idle Timeout）

- ✅ 最佳實踐（Base64 處理、錯誤處理）

- ✅ 完整的檔案結構

*圖 5：使用 Master Prompt 在 AI Studio 中一鍵生成完整應用*

這就是 AI Studio 價值：將迭代過程中的知識累積，轉化為可重複、可分享的開發資產。

總結與展望

收穫：從「寫程式」到「對話式開發」

傳統開發：

想法 → 學習技術 → 寫程式 → 除錯 → 部署

（需要深厚的技術背景，時間成本高）

AI First：

想法 → 用自然語言描述 → AI 生成 → 測試 → 對話修改 → 部署

（會寫 Prompt 就能開發，1.5 小時完成）
（當然你還是要懂軟體工程與軟體架構！)

啟示

想法驗證的速度是關鍵

傳統方式可能花數週實作，最後發現方向不對
AI Studio 讓你在數小時內驗證想法可行性
快速失敗，快速迭代

技術不再是瓶頸

不需要精通 React、Tailwind、API 設計
專注於產品邏輯與使用者需求
AI 處理技術實作細節

Master Prompt 是可複製的資產

迭代過程中累積的知識可以固化為 Prompt
任何人都能用相同 Prompt 重現應用

Google AI Studio 在這次開發過程中的的價值

多模態整合：Imagen + Veo + Gemini 在同一平台

對話式迭代：持續對話中精準修改程式碼

即時反饋：生成 → 測試 → 修改循環只需數分鐘

資源

Google AI Studio - 官方開發平台 https://aistudio.google.com/

Discussion about this post

Ready for more?