,

PixAI 圖生影片教學:模型指南與提示詞撰寫技巧

PixAI 的「圖生影片 」功能讓您能透過強大的動畫工具,賦予靜態圖片生命。無論您是新手還是老用戶,都會發現這次的重大升級:更精簡的介面以及能力大幅增強的新模型。本指南將探索更新後的作業流程、比較各模型優勢,並分享撰寫高效提示詞的專業技巧。

讓我們開始探索全新的 PixAI i2v 體驗吧!

介面導覽

i2v 介面設計直觀,方便您精準控制。以下是主要功能說明:

  • 左側面板: 拖曳或點擊「上傳圖片」以添加您的原始圖源。
  • 右側面板(核心控制區):各模型的設定選項會有所不同。例如:v3.0 (高一致性) 提供更豐富的動作預設,包含多種舞蹈選項;v3.2是目前唯一支援音訊 生成的模型;v2.7 (高動態)獨家支援鏡頭控制功能。
  • 模式(Mode):
    • 專業 (Professional): 高畫質產出(推薦)。
    • 基礎 (Basic): 處理速度較快。
  • 時長: 可選擇 5 秒或 10 秒動畫。雖然長影片看起來很厲害,但對模型渲染的穩定度挑戰也較大。若在測試創意或調整提示詞,建議從 5 秒開始。
  • 提示詞框 : 這是魔法發生的地方。請在這裡輸入場景描述,包含主體、動作與環境。

💡 小撇步: 使用AI 智慧提示詞

提示詞框右上角有一個開關,能協助自動優化您的描述以獲得更佳效果。

  • 鏡頭控制: 下拉選單提供動態效果,如縮放 (Zoom)、平移 (Pan) 或旋轉 (Spin)。註:仅v2.7 支援此選單功能,在支援的模型中使用能大幅提升影片的電影感。
  • 進階設定:
    • 負面提示詞: 排除不想要的結果(如:blurry 模糊, disfigured 變形)。
  • 動作預設 (Action Presets): 提供「親吻」或「擁抱」等快速捷徑,適合提示詞新手。

模型陣容總覽

v3.2 — 電影級音訊敘事者

v3.2 是專為追求「完整故事片段」而非單純動態的創作者所打造。它結合了強大的提示詞遵循能力與流暢的電影感動作,並加入原生音訊 (Native Audio) 功能,讓您的場景能發聲、有呼吸感。這款模型非常適合製作會說話的肖像、角色獨白,或是需要音效來增強感染力的氛圍感場景。

最適合: 說話片段、敘事場景、大氣的劇情呈現、具有「最終剪輯」質感的產出。


v3.0 (高一致性) — 穩定優先的首選

這款模型的核心目標在於「不跑型」。v3.0 (高一致性) 專注於在整個影片片段中保持臉部、服裝和整體風格的高度穩定,減少突然跳變或「角色崩壞」的情況。其動態表現傾向於自然而非誇張,有助於維持令人信服的視覺連貫性。

實戰建議: 對於角色系列作、需要維持視覺身份一致性,以及穩定度比戲劇化運鏡更重要的場景,這是最保險的選擇。


v2.7 (高動態) — 電影級專業模型

這是我們的旗艦級電影感模型,具備以下特色:

  • 進階鏡頭運動模擬: 能夠精準模擬專業攝影機的運鏡軌跡。
  • 電影級動態模糊與景深效果: 賦予影像更深邃的空間感與速度感。
  • 支援簡易提示詞運鏡: 即使只輸入 live 2D 這種簡單的提示詞,它也能自動賦予動態運鏡,讓簡單的輸入也能產生極具張力的結果。

v2.7 (高動態) 旨在提供視覺效果強烈、如同電影大片般的體驗。它擅長處理複雜場景、層次分明的深度感以及大幅度的相機位移,是進行具有動態構圖與敘事需求創作的最佳選擇。


v3.0 Flash — 給快速迭代者的速度之王

v3.0 Flash 是為「動能」而生的模型。當您正在測試創意、精煉提示詞,或需要透過多次嘗試來構建分鏡序列時,Flash 憑藉極快的生成速度和靈活的電影結構(包含多鏡頭切換與轉場風格)讓您的工作流程不中斷。

應用場景: 把它當作您的「草稿與探索」模型:大量生成、多方嘗試、鎖定構思後,如有需要再進行最後磨光。


v2.5 (高靈活性) — 寫實動態模型

當靈活性與風格多樣性最為重要時,v2.5 是您的首選模型。它能駕馭極廣的視覺美學,特別擅長捕捉細微動作、豐富的面部表情,以及在不同提示詞下展現符合物理邏輯的互動。

雖然在處理跳舞或奔跑等複雜動作時,可能需要多生成幾次才能達到完美,但它遵循細節提示詞的能力,以及維持寫實光影與質感的特點,使其成為製作具表現力與高度客製化影片的強大工具。

  • 細膩與動態兼具: 能夠表現角色細微的表情變化與大幅度的肢體動作。
  • 豐富的面部微表情: 捕捉眼神與嘴角等細微的肌肉運動。
  • 物理真實感: 在不同風格間皆能維持可信的光影、陰影表現與物理互動。

獨家功能: 目前只有 v2.5 支援影片 LoRA (Video LoRA),可用於特定動作、舞蹈、Live 2D 或震動效果。我們未來將發布更多影片 LoRA,並開放讓您訓練專屬影片 LoRA 的功能。


掌握提示詞撰寫

現在來到最關鍵的部分——撰寫真正有效的提示詞。與其只給您範例,我們更想解釋每個技巧背後的「為什麼」,讓您能創作出屬於自己的高效提示詞。

一份優秀的提示詞通常遵循以下結構: 提示詞 = 主體 (Subject) + 動作 (Motion) + 環境 (Environment)

讓我們從您的錨點開始,逐層拆解:

第一層:主體定義

既然您使用的是「影像轉影片」,主體在視覺上已經存在,因此不需要過於詳細的角色描述。但仍需在提示詞中加入主體的大致描述,為什麼? 因為這能幫助模型鎖定髮型、服裝或五官等「視覺錨點」,特別是在動作過程中維持一致性。

  • 範例: 「一位白髮、貓耳、紫瞳的少女」

每個描述詞都給了 AI 特定特徵,讓它在動畫過程中進行追蹤與維持。

第二層:動作規範

這是動畫的靈魂。您在告訴模型主體正在做什麼,因此必須具體且有目的性。務必將動作與主體連結。這為什麼重要? 因為這能給模型一個明確的動作目標,以及該「如何」進行動畫處理。

好範例:

「白髮少女用一隻手輕輕整理瀏海,頭部微微傾斜。」

應避免模糊動作,如:

「她四處移動」

建議改寫為:

「她緩慢地向前傾身,撫摸膝蓋上的貓,隨著貓咪發出呼嚕聲,她的表情也變得柔和。」

撰寫小撇步:

  • 使用帶有動作感與風格的動詞(例如:「優雅地躍起」、「快速地瞥一眼」、「帶著遲疑地旋轉」)。
  • 避免單獨使用「移動」或「互動」等抽象詞彙。
  • 將物理動作與情緒細節或節奏感結合。

第三層:環境脈絡

模型也需要知道主體身在何處——這有助於它套用正確的光影、反射、氛圍,甚至是物理效果(如風吹或微粒)。

好範例:

「坐在沐浴在午後陽光的木製教室課桌旁,塵埃微粒在金光中飛舞。」

或:

「黎明時分站在霧氣繚繞的湖邊,柔和的光線反射在水面上。」

這能幫助模型模擬光影變化、大氣壓力與背景互動。

第四層:鏡頭運動 — 非必填

想要電影感?加入鏡頭控制吧。但請保持務實——許多模型僅支援基礎運動,而進階運鏡在 v3.0 或 v2.7 中支援得更好。

提示詞 = 鏡頭運動 + 主體 + 動作 + 環境 + 鏡頭語言

鏡頭提示詞告訴 AI 如何取景以及如何在場景中穿梭。撰寫時,請像導演一樣思考:描述您希望攝影機如何物理性地在空間中導航,無論是向前滑行、向上傾斜還是橫向平移。

關鍵建議:

放置位置: 最重要的是,將鏡頭指令直接放在場景描述中動作發生的位置。例如:「鏡頭緩慢推過人群朝向少女,當她抬頭看著離境告示牌時,過渡到過肩鏡頭。」這樣 AI 就能精確理解何時執行動作而不會產生混淆。

考慮時機: 避免過於複雜的編舞,讓 AI 能乾淨地執行。

鏡頭運動工具箱

運動類型提示詞語法 (Prompt Syntax)最佳使用場景
推鏡頭 (Push In)camera slowly pushes in from [wide/medium] to [close-up]情感揭示、特寫
拉鏡頭 (Pull Back)camera pulls back to reveal [context/environment]交代大環境背景
橫移 (Pan)camera pans smoothly from left to right展現全景、地景掃描
俯仰 (Tilt)camera tilts up from [feet/ground] to [face/sky]角色登場介紹
環繞 (Orbit)camera orbits around the subject [clockwise]動態展示角色全貌
跟鏡 (Track)camera tracks alongside as [subject] moves跟隨動作進行
升降 (Crane)camera cranes up from ground level to bird's eye view戲劇性的規模感改變
移動攝影 (Dolly)smooth dolly shot moving [forward/backward]電影感的接近或遠離

您準備好擔任導演,為您的圖片執導第一場戲了嗎?