模型 vs LoRA 基礎觀念|PixAI 大師之路 Part 1
PixAI 上每張 AI 圖背後的兩大構件。模型是畫家、LoRA 是速寫本。完整新手指南:各自的角色、何時用哪個、如何搭配。
📚 PIXAI 圖像生成大師之路 · 全 5 篇系列
Part 1: 模型 vs LoRA 基礎觀念 ← 你目前在這篇
Part 2: PixAI 提示詞公式 · Rookie
Part 3: LoRA 疊加實戰指南 · Rookie
Part 4: 構圖你的場景 · Advanced
Part 5: 電影級打光與景深 · Master
只要你用過一段時間 PixAI,一定會看到這兩個詞反覆出現 — 模型 和 LoRA。每個生成面板、每篇社群貼文、每個教學裡都有它們。但在你真正搞懂它們是什麼之前,整個系統會一直停在「不太透明」的狀態。你會四處亂點、隨便試,然後困惑為什麼某些組合出來像神圖,下一個組合出來像災難現場。
這篇文章解決這個問題。讀完之後,你會知道模型是什麼、LoRA 是什麼、為什麼它們不同、什麼時候只需要其中一個、什麼時候要兩個都用。一旦這個觀念建立起來,這個系列剩下的內容 — 寫提示詞、疊加 LoRA、構圖、打光 — 都會變得好理解很多。
— PART ONE —
模型 — 畫家
模型是每張 AI 圖的根基。它就是真正在「畫」的那個大腦 — 已經知道臉的結構是怎麼長的、光怎麼落在布料上、人體怎麼組合在一起、動漫風跟寫實風差在哪。當你在 PixAI 上「生成一張圖」時,背後跑的就是模型在解讀你的提示詞,然後把像素生出來。
換個方式想:
▸ MENTAL MODEL
模型就是「一個已經學會畫畫的畫家」。
不同的模型就是不同的畫家。各自有不同的擅長領域、不同的美感、不同的強項跟弱點:
模型決定的事
- 整體的美學範圍 — 動漫、半寫實、2.5D、寫實
- 人體結構能不能畫得乾淨、會不會崩
- 處理光影、構圖的能力
- 預設的色彩偏好 — 飽和、淡雅、偏暖、偏冷
- 整體的線條質感 — 銳利、柔和、速寫感
PIXAI 範例
- Tsubaki.2 — 最新旗艦、細節精緻、現代動漫美學
- Tsubaki — 全能型動漫底模、表現均衡
- Otome V2 — 偏柔、低飽和、浪漫感
- Haruka V2 — 高光強、臉偏可愛系
- Hoshino V2 — 五官較銳利、較成熟
這裡要記住一件事:同一時間只能用一個模型。模型是那個唯一的大腦。你不會把兩個模型疊在一起 — 這張畫布只能選一個畫家。如果風格不對,你不會「再加一個畫家進來」,而是要嘛換一個模型,要嘛留著這個模型、用 LoRA 去調整。
這就帶出了第二個元件。
— PART TWO —
LoRA — 速寫本
LoRA(Low-Rank Adaptation)是一個小型的專用檔案,疊在模型上面,把模型推往某個特定方向。它不是用來取代模型的 — 它是個調整器。沒有模型在底下,LoRA 什麼都做不了。有了模型,它就能把輸出推往特定的風格、角色、或細節。
換個比喻:
▸ MENTAL MODEL
LoRA 是「畫家會翻來看的速寫本」 — 或者說一個風格濾鏡。
畫家(模型)已經會畫畫了。速寫本(LoRA)跟它說:「照這樣畫」 — 某個特定角色的臉、某種服裝風格、某種更柔的光、某種更乾淨的手部結構。
LoRA 體積很小,通常只有幾十 MB。它們大致專做四種工作的其中一種:
JOB 01 · 風格
強化視覺風格
「韓系插畫風」LoRA、「水彩」LoRA、「吉卜力風」LoRA。LoRA 把畫家的輸出拉往那個特定的視覺方向。
JOB 02 · 角色
固定特定角色
OC LoRA、知名動漫角色 LoRA。它用 30 到 100 張參考圖訓練過,能穩定畫出那個角色的髮型、眼神、招牌特徵。
JOB 03 · 細節
修補或強化細節
「better hands」、「更精緻的眼睛」、「更乾淨的線稿」。這類 LoRA 存在的原因是基礎模型常有眾所皆知的弱點,可以用一個專門的 LoRA 來補。
JOB 04 · 元素
加上特定元素
「萌袖」、「貓耳」、「機械風」。LoRA 可以在畫家已經會的東西上面,多教它一個特定的造型元素。
跟模型不一樣的是,LoRA 可以同時用很多個。這就是疊加 — 真正的玩法從這裡開始。系列 Part 3 整篇都在講疊加,但你要先把基礎打穩。
— PART THREE —
並排比較
為了把差異講具體,這邊用每個重要的維度,把模型跟 LoRA 並排比較:
— PART FOUR —
怎麼選的法則
很多人花很多時間糾結要選哪個 LoRA,但真正該問的問題是 到底需不需要 LoRA。對大部分新手來說,答案其實是:可能還不需要。經驗法則:
RULE 01
先單純用模型試。
挑一個本身就靠近你目標的模型。完全不加 LoRA,先生成幾張看看。很多新手會驚訝地發現,光是選對模型,就能直接拿到他們想要的大部分結果,根本不需要 LoRA。
RULE 02
有具體缺口時才加 LoRA。
看著你的輸出,用文字寫下:哪裡缺、哪裡不對。「手畫不好」、「太淡」、「不像我要的角色」。每個被點出來的缺口都是 LoRA 的篩選條件。沒點出缺口就加 LoRA,只是在加雜訊。
RULE 03
不要叫 LoRA 修模型本來就不擅長的東西。
如果你的基礎模型出來就是偏灰,而你想要鮮豔的色彩,沒有 LoRA 能完全救它。直接換一個本來就鮮豔的基礎模型。LoRA 是調整 — 不是重建。
第三條規則幾乎所有新手都會踩。直覺反應是繼續用一開始選的模型,然後一個一個 LoRA 試圖修它。但模型決定了整張圖能去到的範圍,LoRA 只能在那個範圍裡微調。範圍本身不對,就要換模型。
— PART FIVE —
兩者協作
挑好模型之後,LoRA 就是你微調它的工具。實戰中疊加長什麼樣,一個簡單具體的範例:
▸ 範例疊加
BASE Tsubaki.2 → 畫家
LoRA 1 風格 LoRA × 0.7 → 把感覺往那邊推
LoRA 2 細節 LoRA × 0.5 → 補底模的弱點
PROMPT 描述要畫什麼
= 一張聚焦的結果
像看食譜一樣讀:模型是畫家(底層),每個 LoRA 是畫家翻的速寫本 — 「用這個風格畫」、「修這個細節」。強度倍數(× 0.7、× 0.5)控制畫家對每本速寫本的服從程度。
這就是基本結構。實際上要怎麼挑 LoRA、強度該設多少、要怎麼避免它們互相打架,這就是另一整篇的主題了 — 那正是 本系列 Part 3 要講的內容。現在你只需要記得這個結構:1 個模型 + 0 到多個 LoRA、每個 LoRA 都有自己的強度。
跟這些並排還有一個元素,就是提示詞。提示詞講的是 畫什麼 — 主體、動作、場景。模型 + LoRA 決定 怎麼畫。寫好提示詞同樣有自己的結構,那是 Part 2 要處理的事。
— FAQ —
常見問題
可以只用 LoRA 不用模型嗎?
不行。LoRA 單獨什麼也做不了 — 它需要一個基礎模型來修改。PixAI 的生成器永遠都會選定一個模型,LoRA 槽是可選的。把 LoRA 想成調味料:沒有菜要調味的話,調味料也沒用。
任何 LoRA 都能配任何模型嗎?
不行 — 這也是新手最常犯的錯誤。LoRA 是針對特定架構訓練的,只能乾淨地套用到同一個架構訓練出來的模型上。在 PixAI 上大部分的模型卡片跟 LoRA 卡片都會標明架構,但不是全部 — 使用者自己上傳的模型、自己訓練的 LoRA 有時候會留空。架構欄空著的時候,先去看說明、範例圖、留言,再決定要不要載入。如果 LoRA 看起來完全沒效果,第一個要檢查的就是架構有沒有對上。
LoRA 又小又靈活,那為什麼不多疊幾個?
因為它們會打架。每個 LoRA 都把輸出推往某個方向;多個 LoRA 互相拉扯就會產生混濁、不穩定的結果。實務上 2-3 個是大部分情況的甜蜜點。超過這個數字,通常是在補償一個錯的基礎模型,而不是真的在補缺口。系列 Part 3 會深入講疊加策略。
什麼是「觸發詞」?我需要嗎?
很多 LoRA 需要在 prompt 裡放特定關鍵字才會完整啟動 — 角色 LoRA 可能需要角色名字、風格 LoRA 可能需要像 korean illustration style 這樣的標籤。LoRA 的模型頁會說明它預期的觸發詞。如果 LoRA 看起來沒效果,「缺少觸發詞」是第二常見的原因(第一名是架構不符)。
在 PixAI 上怎麼找好的模型跟 LoRA?
PixAI 的 Market 是核心資料庫 — 可以用名稱搜、按分類瀏覽、按熱門度排序。最快的學習捷徑是去社群 feed 找你喜歡的圖,然後看作者用了什麼模型 + LoRA(大部分公開貼文都會顯示後設資料)。建立一份你自己的「我信任的模型」跟「我知道效果的 LoRA」清單 — 真正會用 PixAI 的人,都是從這一步開始的。
— PART 2 準備就緒 —
挑個模型,開始生成
打開生成器。挑一個看起來接近你想要的模型。先不加 LoRA 跑一次。看你想要的跟跑出來的之間有什麼缺口。那個缺口會告訴你 — 如果有需要的話 — 接下來要加什麼。
