AI 插畫構圖完全指南 | PixAI 大師之路 Part 4

PixAI 進階指南:5 種鏡頭類型、毀掉畫面的 4 種衝突、專業插畫師都用的 4 步驟修正循環。

SCENE 04 // TAKE 01
DIR. PIXAI
— ROLL —
4/5 SERIES

— PART 4 OF 5 · ADVANCED —

構圖你的場景
— 不只是把 prompt 堆在一起

大部分人不是不會寫 tag — 而是腦袋裡沒有「畫面」。停止堆字。開始用導演的角度,把場景組起來。

▸ 開啟 PixAI

📚 PixAI 圖像生成大師之路 · 全 5 篇系列

Part 1: 模型 vs LoRA 基礎觀念 · Rookie

Part 2: PixAI 提示詞公式 · Rookie

Part 3: LoRA 疊加實戰指南 · Rookie

Part 4: 構圖你的場景 ← 你目前在這篇

Part 5: 電影級打光與景深 · Master

到這裡,你會寫 prompt 了。也會疊加合適的 LoRA。但成品還是看起來像把一串特徵貼在畫布上 — 不是會讓觀眾停下來看的「場景」。

這篇文章就是要補上這道缺口。問題不在 tag,是你還沒在「構圖」。構圖的意思是 — 在還沒寫下任何一個字之前,就先決定這張圖「在講什麼」,然後讓每一個選擇 — 畫面裡有什麼、主體在哪、做什麼動作 — 都為那個意圖服務。這就是漂亮的圖跟會說故事的圖之間的分界線。

— PART ONE —

寫之前,先把畫面想出來

最常見的失誤就是直接跳去寫 tag。”1girl, beautiful, cinematic, masterpiece” 一丟下去,希望生出一張像樣的圖。幾乎都會失敗,因為這張圖背後沒有想法

正確做法是 — 先在腦袋裡把畫面想出來。順序問三個問題就好:

QUESTION 01

這個世界裡有什麼?

從主題開始,列出最有代表性的環境元素。「春天」就是:花、草地、柔和陽光。這是畫面的「存在基礎」 — 物理脈絡。

QUESTION 02

正在發生什麼?

讓環境推導動作。在草地上,坐著比站著自然;站著反而帶孤獨感。再加一個變化因素 — 風、光、落花瓣 — 讓人物對它做出反應。風吹起頭髮、人物伸手按住。動作開始有因果,不是裝飾。

QUESTION 03

要讓觀眾看多少?

這就是鏡頭類型。想表達「春天的開闊感」就用廣角鏡頭,給環境留空間。想要強烈情緒就拉近。本質是資訊分配:環境跟人物各佔多少比例。

每一題的答案都接著下一題。主題決定環境、環境決定動作、動作決定取景。這就是構圖。少了任何一步,你又掉回堆字模式。

— PART TWO —

5 種鏡頭類型,叫得出名字才會用

每一種都是真實的電影術語,PixAI 的模型都認得。寫進你的提示詞裡,控制觀眾接收到多少資訊。

廣角鏡頭構圖提示詞範例 — PixAI、小主體與廣闊環境

SHOT № 01

廣角鏡頭 (Wide Shot)

提示詞: wide shot

畫面表現:最遠的取景。人物只佔一小部分,環境主導。

跟觀眾說的話:「這個人在哪裡」,而不是「這個人是誰」。

適合:建立場景 — 天台、街道、森林。看不清表情,所以情緒會比較弱。

SHOT № 02

中景 (Medium Shot)

提示詞: medium shot

畫面表現:大約取到腰部以上。人物跟環境平衡。

跟觀眾說的話:「這裡有個人,在這個地方」。最穩定、最日常的視角。

適合:對話、互動、平靜情緒。不太適合強烈情感。

中景構圖提示詞範例 — PixAI、腰部以上取景與平衡的環境

牛仔鏡頭構圖提示詞範例 — PixAI、大腿以上強調人物

SHOT № 03

牛仔鏡頭 (Cowboy Shot)

提示詞: cowboy shot

畫面表現:中景的變體 — 取景到大腿上方。源自西部片,本來是為了給觀眾看到角色腰間的槍。

跟觀眾說的話:「這個角色有氣場」。

適合:不丟掉太多身體的同時,呈現姿態跟氣勢。

SHOT № 04

近景 (Close-up)

提示詞: close up

畫面表現:進一步推近。環境弱化,觀眾的注意力自然集中到表情、眼神、動作。

跟觀眾說的話:「讀這個表情」。

適合:情緒場景、角色反應、浪漫橋段。

近景構圖提示詞範例 — PixAI、以表情為主體

特寫構圖提示詞範例 — PixAI、放大情緒的極端近距離

SHOT № 05

特寫 (Choker Shot)

提示詞: choker shot

畫面表現:最近的取景。通常只剩臉部,有時只有眼睛或嘴巴。環境完全消失。

跟觀眾說的話:「感受這個 — 沒別的了」。

適合:情緒強烈的鏡頭。用太多會失去節奏,要節制使用。

退得越遠,給的資訊越多;推得越近,情緒越強。挑一個跟你場景核心對應的鏡頭。

— PART THREE —

毀掉 AI 構圖的 4 種衝突

大部分「AI 出包了」的時刻,其實不是模型失敗,而是 prompt 內部的衝突 — 互相打架的指令。模型試著兩邊都滿足,結果就變成兩邊都不像的扭曲版本。

能叫得出 4 種最常見的衝突名字之後,你就能在自己的作品裡幾秒就找出來。

CONFLICT 01

動作衝突

「倚靠欄杆」+「展示完整服裝」

→ 姿勢扭曲。倚靠的同時不可能把所有衣物都展示清楚,總有什麼會被擰歪。

CONFLICT 02

構圖衝突

「from side」+「想看清表情」

→ 情緒消失。側面構圖跟臉部重點互打。取景把觀眾的視線從你想被看到的地方帶開。

CONFLICT 03

資訊衝突

「兩人對視」寫得太直白

→ 想像空間消失。直接說出來,觀眾就感受不到那份連結。要展示,不要直說。

CONFLICT 04

密度衝突

背景元素太多

→ 沒有留白。畫面變成資訊過載。沒有負空間,觀眾的視線就找不到落腳點。

— PART FOUR —

4 步驟修正循環

每一次修正 AI 圖,都遵循同樣的 4 步循環。順序很重要。跳過一步,下一步幾乎一定會失敗。

▸ THE LOOP

01 SET TONE — 定義你想表達什麼

02 FIND CONFLICT — 找出哪裡互相矛盾

03 RESTRATEGIZE — 用新策略換掉衝突

04 STRENGTHEN — 氛圍細節最後加

大部分人會犯的錯:從第 4 步開始。把「cinematic lighting, 8k, masterpiece, beautiful」丟到一張結構壞掉的圖上,然後懷疑為什麼一點都沒變好。修飾沒辦法救結構。我們用 3 個實戰案例來看這個循環怎麼跑。

CASE STUDY № 01

天台相約

意圖:「角色在天台的安靜時刻 — 一種陪伴感」。

天台場景初次嘗試 — 倚靠動作與展示完整服裝衝突,姿勢扭曲

▸ TAKE 01 — DRAFT

FIND CONFLICT

姿勢怪異的人物。原本希望角色倚靠在欄杆看遠方,鏡頭從側面 — 想要那種安靜的「存在感」。但 prompt 也包含完整的從上到下服裝設定。模型試著同時滿足兩邊。結果:扭曲彆扭的姿勢。經典動作衝突。

RESTRATEGIZE — 動作

不要讓角色完全倚靠。手放在欄杆上就好。加 upper body 集中畫面,放鬆衣裝 tag。姿勢穩定了 — 但視覺中心離開了臉。原本想要的「存在感」反而變弱。修一個衝突就跑出新的衝突 — 這很正常,所以這是個「循環」,不是清單。

天台場景修正 — 姿勢穩定但視覺中心被拉到側邊,臉部失焦

▸ TAKE 02 — REVISED

天台場景第三次 — 正面取景重新讓臉部成為焦點

▸ TAKE 03 — FACING FRONT

RESTRATEGIZE — 取景

如果目標是讓觀眾感受角色的表情,那就拿掉 from side。把角色拉回正面中心。表情回到視覺核心 — 清晰、有存在感。

STRENGTHEN — 細節最後

到這時才加氛圍。floating hair 打破靜態感、增加生動。backlight 讓光影更有質感、給背景城市份量。同樣的構圖 — 現在有氛圍了。

天台場景最終 — 在穩定的構圖上加 floating hair 與 backlight 強化氛圍

▸ TAKE 04 — FINAL

解法不是改 prompt,是改策略 — 讓目標 (存在感 + 表情) 主導,把矛盾的指令拿掉。細節最後才加,因為地基終於穩了。

CASE STUDY № 02

地雷系 Mio 拼湊水手服 Mio

意圖:「地雷系 Mio 在拼水手服 Mio 的拼圖。氛圍要夢幻、童話感」。

SET TONE — 挑風格。先找到一個夢幻、童話感的基底風格。試了三個候選:

米奧拼圖風格試驗 1 — lucid dreamy 美學測試

lucid dreamy

米奧拼圖風格試驗 2 — classic japanese 美學測試

classic japanese

米奧拼圖風格試驗 3 — luminous impasto 美學測試

luminous impasto

三個都符合夢幻意圖。最後選了柔軟、空靈感最強的「lucid dreamy」。基調定了。

米奧拼圖第一次迭代 — 身體露太多、視線太直白的初次嘗試

▸ ITERATION 01

FIND CONFLICT — 資訊太直白

水手服 Mio 露出的身體比例太多 — 視線分散。而且地雷系 Mio 跟水手服 Mio 的對視寫得太死,留不下任何想像空間。就是兩個角色在互看。親密感在哪?

RESTRATEGIZE — 內省鏡頭

拿掉直接對視。電影有一種手法叫做內省鏡頭 — 角色不跟「外界」互動,從而產生靜謐感、故事感。水手服 Mio 完全側身 (但仍在中心),閉上眼,雙手放在胸口。姿勢不是空的,而是安靜的。沉默不必說,就傳達了溫柔。

米奧拼圖第二次迭代 — 改成側身閉眼的內省鏡頭、安靜氛圍

▸ ITERATION 02

米奧拼圖最終 — 加上花草、柔焦背景、更柔的光,完成童話氛圍

▸ FINAL — STRENGTHENED

STRENGTHEN — 氛圍

背景對童話來說太單調了。加入花跟草。但這又造出新的密度問題 — 前景跟背景的細節在搶戲。

解法:soft bokeh effect 把周遭的花虛化,留白回來了。整體光線變柔。現在夢幻感完整傳達了。

CASE STUDY № 03 · QUICK PASS

花火大會

意圖:「兩個角色在花火大會 — 怦然心動的浪漫一刻」。

快速套用循環:基調 → 衝突 → 策略 → 強化。三次迭代:

花火大會場景第一次迭代 — 基調太疏離,跟浪漫意圖不合

▸ TAKE 01 · TONE SET

畫風換成夢幻少女系。但取景太寬,臉部沒有焦點。衝突:情緒應該落在臉上,但視線去不到那。

花火大會場景第二次迭代 — 加上 face focus、收緊取景

▸ TAKE 02 · REFRAMED

移除地雷系 Mio 的裙子描述。加 face focus。鏡頭鎖在兩人之間的瞬間。但花火大會的主題在淡化 — 背景人物沒有被讀成參加者。

花火大會場景最終 — 一方換成和服恢復場合脈絡,加害羞表情強化

▸ TAKE 03 · STRENGTHENED

把其中一個角色的衣服換成和服 — 花火大會的脈絡回來了。加上害羞的 tag、強化臉部表情。「怦然心動」的情緒乾淨地落在臉上。

同一個循環,更快的版本。基調 → 衝突 → 策略 → 細節。案例簡單不代表順序可以變。

— PART FIVE —

構圖的 3 個原則

就算你忘掉所有的鏡頭類型跟衝突類型,留住這 3 個原則就夠:

1. 基調優先於設定。

如果角色的衣裝描述跟你預期的氛圍打架,那輸的是衣裝描述。一切都要為表達服務 — 包括你原本以為很重要的那些細節。猶豫的時候,砍掉那些不為基調服務的東西。

2. 視覺中心必須明確。

觀眾第一眼落到的地方,必須是你最想被看到的東西。如果他們得「找」,你就輸了。構圖決定這一點,光線強化。(光線的部分看 第 5 篇。)

3. 留白要保留。

畫面需要被感受的空間,不只是被看的。背景散景、簡單的取景、清爽的前景 — 這些不是極簡選擇,是情感選擇。把畫面塞滿細節,情緒就被壓平了。

— FAQ —

常見問題

鏡頭類型放 prompt 開頭還是結尾?

放前面 — 通常在主體後面就好。PixAI 的模型大致是按重要性順序讀 prompt 的,所以 1girl, wide shot, ... 會讓模型先把取景定下來,再去解決其他。放最後的話,取景容易變成事後處理。

姿勢一直跑掉。是模型壞了嗎?

幾乎可以確定是動作衝突 (Conflict 01)。看一下你的 prompt:是不是同時要求一個特定姿勢、一個特定衣裝、一個特定取景?拿掉一個試試姿勢有沒有穩。穩了就是找到衝突了;沒穩可能是基底模型問題 — 換一個解剖能力強的模型試試。

廣角鏡頭跟近景,什麼時候用哪個?

問自己:這張圖是關於哪裡還是?廣角鏡頭給「哪裡」 — 建立天台、街道、森林。近景給「誰」 — 情緒反應、親密一刻。如果答案是「兩個都重要」,通常選中景。

構圖感覺好麻煩。我可以先生再修嗎?

可以,但你會燒掉很多次生成。在寫 prompt 之前花 2 分鐘把畫面想清楚,通常省下 10 次「差一點點」的生成。構圖是 AI 創作裡 CP 值最高的思考步驟。

SCENE 04 // CUT
FADE OUT —

— THAT’S A WRAP —

現在去導你自己的場景

挑一個基調。想像一個畫面。找出衝突。換策略。修飾留到最後。這就是全部 — 也是「生成出來的圖」跟「構圖出來的圖」之間的差別。

▸ 開啟 PixAI

讀完整個系列

PART 1 · ROOKIE

模型 vs LoRA 基礎觀念 →

理解每張 AI 插畫背後的兩大組件。

PART 2 · ROOKIE

PixAI 提示詞公式 →

能穩定產出好結果的 6 段提示詞結構。

PART 3 · ROOKIE

LoRA 疊加實戰指南 →

找出輸出缺什麼、用對的 LoRA 補回去。

PART 5 · MASTER · NEXT

電影級打光與景深 →

10 種打光、色彩理論、景深控制。

內容索引