AI 插畫構圖完全指南 | PixAI 大師之路 Part 4

SCENE 04 // TAKE 01

DIR. PIXAI

— ROLL —

4/5 SERIES

— PART 4 OF 5 · ADVANCED —

構圖你的場景
— 不只是把 prompt 堆在一起

大部分人不是不會寫 tag — 而是腦袋裡沒有「畫面」。停止堆字。開始用導演的角度，把場景組起來。

▸ 開啟 PixAI

📚 PixAI 圖像生成大師之路 · 全 5 篇系列

Part 1: 模型 vs LoRA 基礎觀念 · Rookie

Part 2: PixAI 提示詞公式 · Rookie

Part 3: LoRA 疊加實戰指南 · Rookie

Part 4: 構圖你的場景 ← 你目前在這篇

Part 5: 電影級打光與景深 · Master

到這裡，你會寫 prompt 了。也會疊加合適的 LoRA。但成品還是看起來像把一串特徵貼在畫布上 — 不是會讓觀眾停下來看的「場景」。

這篇文章就是要補上這道缺口。問題不在 tag，是你還沒在「構圖」。構圖的意思是 — 在還沒寫下任何一個字之前，就先決定這張圖「在講什麼」，然後讓每一個選擇 — 畫面裡有什麼、主體在哪、做什麼動作 — 都為那個意圖服務。這就是漂亮的圖跟會說故事的圖之間的分界線。

— PART ONE —

寫之前，先把畫面想出來

最常見的失誤就是直接跳去寫 tag。”1girl, beautiful, cinematic, masterpiece” 一丟下去，希望生出一張像樣的圖。幾乎都會失敗，因為這張圖背後沒有想法。

正確做法是 — 先在腦袋裡把畫面想出來。順序問三個問題就好:

QUESTION 01

這個世界裡有什麼?

從主題開始，列出最有代表性的環境元素。「春天」就是:花、草地、柔和陽光。這是畫面的「存在基礎」 — 物理脈絡。

QUESTION 02

正在發生什麼?

讓環境推導動作。在草地上，坐著比站著自然；站著反而帶孤獨感。再加一個變化因素 — 風、光、落花瓣 — 讓人物對它做出反應。風吹起頭髮、人物伸手按住。動作開始有因果，不是裝飾。

QUESTION 03

要讓觀眾看多少?

這就是鏡頭類型。想表達「春天的開闊感」就用廣角鏡頭，給環境留空間。想要強烈情緒就拉近。本質是資訊分配:環境跟人物各佔多少比例。

每一題的答案都接著下一題。主題決定環境、環境決定動作、動作決定取景。這就是構圖。少了任何一步，你又掉回堆字模式。

— PART TWO —

5 種鏡頭類型，叫得出名字才會用

每一種都是真實的電影術語，PixAI 的模型都認得。寫進你的提示詞裡，控制觀眾接收到多少資訊。

SHOT № 01

廣角鏡頭 (Wide Shot)

提示詞: wide shot

畫面表現:最遠的取景。人物只佔一小部分，環境主導。

跟觀眾說的話:「這個人在哪裡」，而不是「這個人是誰」。

適合:建立場景 — 天台、街道、森林。看不清表情，所以情緒會比較弱。

SHOT № 02

中景 (Medium Shot)

提示詞: medium shot

畫面表現:大約取到腰部以上。人物跟環境平衡。

跟觀眾說的話:「這裡有個人，在這個地方」。最穩定、最日常的視角。

適合:對話、互動、平靜情緒。不太適合強烈情感。

SHOT № 03

牛仔鏡頭 (Cowboy Shot)

提示詞: cowboy shot

畫面表現:中景的變體 — 取景到大腿上方。源自西部片，本來是為了給觀眾看到角色腰間的槍。

跟觀眾說的話:「這個角色有氣場」。

適合:不丟掉太多身體的同時，呈現姿態跟氣勢。

SHOT № 04

近景 (Close-up)

提示詞: close up

畫面表現:進一步推近。環境弱化，觀眾的注意力自然集中到表情、眼神、動作。

跟觀眾說的話:「讀這個表情」。

適合:情緒場景、角色反應、浪漫橋段。

SHOT № 05

特寫 (Choker Shot)

提示詞: choker shot

畫面表現:最近的取景。通常只剩臉部，有時只有眼睛或嘴巴。環境完全消失。

跟觀眾說的話:「感受這個 — 沒別的了」。

適合:情緒強烈的鏡頭。用太多會失去節奏，要節制使用。

退得越遠，給的資訊越多；推得越近，情緒越強。挑一個跟你場景核心對應的鏡頭。

— PART THREE —

毀掉 AI 構圖的 4 種衝突

大部分「AI 出包了」的時刻，其實不是模型失敗，而是 prompt 內部的衝突 — 互相打架的指令。模型試著兩邊都滿足，結果就變成兩邊都不像的扭曲版本。

能叫得出 4 種最常見的衝突名字之後，你就能在自己的作品裡幾秒就找出來。

CONFLICT 01

動作衝突

「倚靠欄杆」+「展示完整服裝」

→ 姿勢扭曲。倚靠的同時不可能把所有衣物都展示清楚，總有什麼會被擰歪。

CONFLICT 02

構圖衝突

「from side」+「想看清表情」

→ 情緒消失。側面構圖跟臉部重點互打。取景把觀眾的視線從你想被看到的地方帶開。

CONFLICT 03

資訊衝突

「兩人對視」寫得太直白

→ 想像空間消失。直接說出來，觀眾就感受不到那份連結。要展示，不要直說。

CONFLICT 04

密度衝突

背景元素太多

→ 沒有留白。畫面變成資訊過載。沒有負空間，觀眾的視線就找不到落腳點。

— PART FOUR —

4 步驟修正循環

每一次修正 AI 圖，都遵循同樣的 4 步循環。順序很重要。跳過一步，下一步幾乎一定會失敗。

▸ THE LOOP
SET TONE — 定義你想表達什麼
FIND CONFLICT — 找出哪裡互相矛盾
RESTRATEGIZE — 用新策略換掉衝突
STRENGTHEN — 氛圍細節最後加

大部分人會犯的錯：從第 4 步開始。把「cinematic lighting, 8k, masterpiece, beautiful」丟到一張結構壞掉的圖上，然後懷疑為什麼一點都沒變好。修飾沒辦法救結構。我們用 3 個實戰案例來看這個循環怎麼跑。

CASE STUDY № 01

天台相約

意圖:「角色在天台的安靜時刻 — 一種陪伴感」。

▸ TAKE 01 — DRAFT

FIND CONFLICT

姿勢怪異的人物。原本希望角色倚靠在欄杆看遠方，鏡頭從側面 — 想要那種安靜的「存在感」。但 prompt 也包含完整的從上到下服裝設定。模型試著同時滿足兩邊。結果：扭曲彆扭的姿勢。經典動作衝突。

RESTRATEGIZE — 動作

不要讓角色完全倚靠。手放在欄杆上就好。加 upper body 集中畫面，放鬆衣裝 tag。姿勢穩定了 — 但視覺中心離開了臉。原本想要的「存在感」反而變弱。修一個衝突就跑出新的衝突 — 這很正常，所以這是個「循環」，不是清單。

▸ TAKE 02 — REVISED

▸ TAKE 03 — FACING FRONT

RESTRATEGIZE — 取景

如果目標是讓觀眾感受角色的表情，那就拿掉 from side。把角色拉回正面中心。表情回到視覺核心 — 清晰、有存在感。

STRENGTHEN — 細節最後

到這時才加氛圍。floating hair 打破靜態感、增加生動。backlight 讓光影更有質感、給背景城市份量。同樣的構圖 — 現在有氛圍了。

天台場景最終 — 在穩定的構圖上加 floating hair 與 backlight 強化氛圍

▸ TAKE 04 — FINAL

解法不是改 prompt，是改策略 — 讓目標 (存在感 + 表情) 主導，把矛盾的指令拿掉。細節最後才加，因為地基終於穩了。

CASE STUDY № 02

地雷系 Mio 拼湊水手服 Mio

意圖:「地雷系 Mio 在拼水手服 Mio 的拼圖。氛圍要夢幻、童話感」。

SET TONE — 挑風格。先找到一個夢幻、童話感的基底風格。試了三個候選：

lucid dreamy

classic japanese

luminous impasto

三個都符合夢幻意圖。最後選了柔軟、空靈感最強的「lucid dreamy」。基調定了。

▸ ITERATION 01

FIND CONFLICT — 資訊太直白

水手服 Mio 露出的身體比例太多 — 視線分散。而且地雷系 Mio 跟水手服 Mio 的對視寫得太死，留不下任何想像空間。就是兩個角色在互看。親密感在哪？

RESTRATEGIZE — 內省鏡頭

拿掉直接對視。電影有一種手法叫做內省鏡頭 — 角色不跟「外界」互動，從而產生靜謐感、故事感。水手服 Mio 完全側身 (但仍在中心)，閉上眼，雙手放在胸口。姿勢不是空的，而是安靜的。沉默不必說，就傳達了溫柔。

▸ ITERATION 02

▸ FINAL — STRENGTHENED

STRENGTHEN — 氛圍

背景對童話來說太單調了。加入花跟草。但這又造出新的密度問題 — 前景跟背景的細節在搶戲。

解法：soft bokeh effect 把周遭的花虛化，留白回來了。整體光線變柔。現在夢幻感完整傳達了。

CASE STUDY № 03 · QUICK PASS

花火大會

意圖:「兩個角色在花火大會 — 怦然心動的浪漫一刻」。

快速套用循環:基調 → 衝突 → 策略 → 強化。三次迭代:

▸ TAKE 01 · TONE SET

畫風換成夢幻少女系。但取景太寬，臉部沒有焦點。衝突：情緒應該落在臉上，但視線去不到那。

▸ TAKE 02 · REFRAMED

移除地雷系 Mio 的裙子描述。加 face focus。鏡頭鎖在兩人之間的瞬間。但花火大會的主題在淡化 — 背景人物沒有被讀成參加者。

▸ TAKE 03 · STRENGTHENED

把其中一個角色的衣服換成和服 — 花火大會的脈絡回來了。加上害羞的 tag、強化臉部表情。「怦然心動」的情緒乾淨地落在臉上。

同一個循環，更快的版本。基調 → 衝突 → 策略 → 細節。案例簡單不代表順序可以變。

— PART FIVE —

構圖的 3 個原則

就算你忘掉所有的鏡頭類型跟衝突類型，留住這 3 個原則就夠：

1. 基調優先於設定。

如果角色的衣裝描述跟你預期的氛圍打架，那輸的是衣裝描述。一切都要為表達服務 — 包括你原本以為很重要的那些細節。猶豫的時候，砍掉那些不為基調服務的東西。

2. 視覺中心必須明確。

觀眾第一眼落到的地方，必須是你最想被看到的東西。如果他們得「找」，你就輸了。構圖決定這一點，光線強化。(光線的部分看第 5 篇。)

3. 留白要保留。

畫面需要被感受的空間，不只是被看的。背景散景、簡單的取景、清爽的前景 — 這些不是極簡選擇，是情感選擇。把畫面塞滿細節，情緒就被壓平了。

— FAQ —

常見問題

鏡頭類型放 prompt 開頭還是結尾？

放前面 — 通常在主體後面就好。PixAI 的模型大致是按重要性順序讀 prompt 的，所以 1girl, wide shot, ... 會讓模型先把取景定下來，再去解決其他。放最後的話，取景容易變成事後處理。

姿勢一直跑掉。是模型壞了嗎？

幾乎可以確定是動作衝突 (Conflict 01)。看一下你的 prompt：是不是同時要求一個特定姿勢、一個特定衣裝、一個特定取景？拿掉一個試試姿勢有沒有穩。穩了就是找到衝突了；沒穩可能是基底模型問題 — 換一個解剖能力強的模型試試。

廣角鏡頭跟近景，什麼時候用哪個？

問自己：這張圖是關於哪裡還是誰？廣角鏡頭給「哪裡」 — 建立天台、街道、森林。近景給「誰」 — 情緒反應、親密一刻。如果答案是「兩個都重要」，通常選中景。

構圖感覺好麻煩。我可以先生再修嗎？

可以，但你會燒掉很多次生成。在寫 prompt 之前花 2 分鐘把畫面想清楚，通常省下 10 次「差一點點」的生成。構圖是 AI 創作裡 CP 值最高的思考步驟。

SCENE 04 // CUT

FADE OUT —

— THAT’S A WRAP —

現在去導你自己的場景

挑一個基調。想像一個畫面。找出衝突。換策略。修飾留到最後。這就是全部 — 也是「生成出來的圖」跟「構圖出來的圖」之間的差別。

▸ 開啟 PixAI

讀完整個系列

PART 1 · ROOKIE

模型 vs LoRA 基礎觀念 →

理解每張 AI 插畫背後的兩大組件。

PART 2 · ROOKIE

PixAI 提示詞公式 →

能穩定產出好結果的 6 段提示詞結構。

PART 3 · ROOKIE

LoRA 疊加實戰指南 →

找出輸出缺什麼、用對的 LoRA 補回去。

PART 5 · MASTER · NEXT

電影級打光與景深 →

10 種打光、色彩理論、景深控制。

構圖你的場景 — 不只是把 prompt 堆在一起