AIアート構図ガイド|PixAIマスタリー Part 4

単語を並べるだけのプロンプトから卒業しよう。
PixAIで“構図として成立するAIアート”を作るために、5つのショット構成、シーンを壊す4つの衝突要因、そして改善のための4ステップ診断ループを徹底解説。実践的な3つのケーススタディも収録。

SCENE 04 // TAKE 01
DIR. PIXAI
— ROLL —
5/5 SERIES

— 全5回・上級編 PART 4 —

シーンを構成する — “単語の積み上げ”を超えて

多くのAIイラスト制作者が失敗する理由は、タグを書けないからではありません。“画面を想像できていない”からです。 単語を積み重ねるだけではなく、映画監督のように“シーンを構成する”発想へ。 そこから、AIアートは一段上の表現になります。

▸ PixAIを開く

📚 PixAI 画像生成マスタリー · 全 5 回シリーズ

Part 1: モデル vs LoRA 基礎編 |入門編

Part 2: PixAIプロンプト公式 |入門編

Part 3: LoRAスタッキングガイド |入門編

Part 4: AIアート構図ガイド ← いまここ

Part 5: シネマティックライティング&奥行き表現 |達人編

ここまでで、“動くプロンプト”は書けるようになったはずです。適切な LoRA も重ねられる。でも、まだ生成結果が「要素を並べただけの絵」に感じることはありませんか? 綺麗ではある。でも、 “シーン” になっていない。それが、この章で埋めるギャップです。 問題はタグではありません。まだ“構図”で考えられていないのです。 構図とは、プロンプトを書く前に「この画像は何を伝えるのか?」を決めること。そして、 ・何を画面に入れるのか ・どこに被写体を置くのか ・何をさせるのか そのすべてを、“伝えたい意図”のために設計していくことです。それこそが、ただ綺麗な画像と、“何かを語る絵”を分ける違いです。

— PART ONE —

書く前に、“画面”を想像する

もっとも多い失敗は、いきなりタグを書き始めてしまうことです。 1girl, beautiful, cinematic, masterpiece……そんなふうに並べて、なんとなく良い絵が出ることを期待してしまう。 ですが、実際にはほとんど上手くいきません。なぜなら、その単語の下に“イメージ”が存在していないからです。 まず最初にやるべきなのは、頭の中で“画面”を作ること。考えるべき質問は、順番に3つあります。

QUESTION 01

この世界には、何がある?

まずはテーマから考えます。そのシーンを象徴する環境要素を書き出しましょう。 たとえば「春」なら: ・花 ・草原 ・柔らかな日差し など。 これは“存在の土台”です。シーンがどんな空間の中に存在しているのかを決めます。

QUESTION 02

そこで、何が起きている?

次は、環境から自然に動作を導きます。草原なら、座っている方が自然かもしれない。逆に立っていると、少し孤独感が出る。 そこにさらに、風、光、舞う花びらなどの“変化要因”を加えます。 風が吹く。 髪が揺れる。 キャラクターが髪を押さえる。 すると、その動作には“理由”が生まれます。 ただの飾りではなく、シーンの中で起きている出来事になるのです。

QUESTION 03

観る人に、どこまで見せる?

観る人に、どこまで見せる? これは“ショット設計”です。 「春の開放感」を伝えたいなら、広めの構図にして背景をしっかり見せる。 逆に感情の強さを伝えたいなら、もっと寄った構図にする。 つまりこれは、“背景をどれだけ見せるか” vs “キャラクターをどれだけ見せるか”という、情報配分の設計です。

それぞれの答えは、次の答えへ繋がっています。 テーマが環境を決める。環境が動作を生む。動作が構図を決める。これが“構図”です。 どれか1つを飛ばしてしまうと、結局また“単語を積み上げるだけ”に戻ってしまいます。

— PART TWO —

構図で使える、5つの基本ショット

ここで紹介するのは、実際の映像制作でも使われている構図用語です。 そしてPixAIのモデルも、これらをプロンプトタグとして認識できます。 つまり、“どれだけの情報を観る人へ見せるか”を、ショット指定でコントロールできるということです。

ワイドショット構図のプロンプト例 — PixAI、小さな主体と広大な環境

SHOT № 01

ワイドショット (prompt: wide shot)

プロンプト: wide shot

見え方:もっとも引いた構図。キャラクターは画面の一部だけを占め、環境が主役になります。

観る人へ伝わるもの:「この人はどこにいるのか?」つまり、“人物そのもの”より“場所”を見せるショットです。

向いているシーン:屋上、街並み、森などのロケーション描写。顔が小さくなるため、感情表現はやや弱くなります。

SHOT № 02

ミディアムショット (prompt: medium shot)

プロンプト: medium shot

見え方:腰上あたりまで映る、もっとも標準的な構図。 キャラクターと背景のバランスが取れています。

観客に伝えるもの:“「この場所に、この人物がいる」もっとも自然で、日常的なショットです。

向いているシーン:会話、交流、穏やかな感情表現。逆に、強烈な感情演出には少し弱めです。

ミディアムショット構図のプロンプト例 — PixAI、腰から上のフレーミングとバランスのとれた環境
カウボーイショット構図のプロンプト例 — PixAI、太もも上からのキャラ強調

SHOT № 03

カウボーイショット (prompt: cowboy shot)

プロンプト: cowboy shot

見え方:太もも上あたりから映す構図。西部劇でホルスターを映すために生まれたショットです。

観る人へ伝わるもの:「このキャラクターには存在感がある」

適した用途:ポーズやオーラを見せたい時。全身感を残しつつ、キャラクター性もしっかり伝えられます。

SHOT № 04

クローズアップ (prompt: close up)

プロンプト: close up

見え方:さらに寄った構図。背景情報は薄れ、視線は自然と顔・目・仕草へ集中します。

観る人へ伝わるもの:「この表情を見てほしい」

向いているシーン:感情表現、リアクション、恋愛シーン。

クローズアップ構図のプロンプト例 — PixAI、表情を主体とする
チョーカーショット構図のプロンプト例 — PixAI、最高度の感情のための極端なクローズアップ

SHOT № 05

チョーカーショット (prompt: choker shot)

プロンプト: choker shot

見え方:もっとも近い構図。顔だけ、あるいは目元や口元だけになることもあります。背景情報はほぼ消えます。

観る人へ伝わるもの:「この感情だけを感じてほしい」

向いているシーン:感情を強くぶつけたい場面。ただし、多用すると画面のリズムが単調になります。ここぞという場面で使いましょう。

引けば引くほど、情報量は増える。寄れば寄るほど、感情は強くなる。大切なのは、“自分のシーンが何を伝えたいのか”に合わせてショットを選ぶことです。

学んだ構図を、PixAI で試してみよう

PixAIを無料で体験

— PART THREE —

AI構図を壊す、4つの衝突

「AIが思った通りに描いてくれない」そう感じる時、原因はモデル性能ではないことがほとんどです。 本当の問題は、プロンプト内部で“指示同士が衝突している”こと。 モデルは両方を同時に満たそうとするため、結果として、どちらにもなりきれない崩れた画像になります。 この“よくある4つの衝突”を理解すると、自分のプロンプトの問題点も一瞬で見抜けるようになります。

CONFLICT 01

動作の衝突

「手すりにもたれかかる」 +「全身コーデを頭から足までしっかり見せる」

→ ポーズが崩れる。 キャラクターは、“自然にもたれながら”“服の全ディテールも完璧に見せる”この両方を同時には成立させにくいのです。 結果として、身体や構図が不自然にねじれます。

CONFLICT 02

構図の衝突

「横顔構図」 + 「表情をしっかり見せたい」

→ 感情が伝わらない。 横向き構図は、そもそも顔の情報量を減らすショットです。 つまり、“感情を見せたい”という目的と、“横から撮る”という構図が互いに衝突しています。 画面自体が、観る人の視線を“見せたいもの”から遠ざけてしまうのです。

CONFLICT 03

情報の衝突

「二人が見つめ合っている」を、そのまま説明しすぎる

→ 想像する余地が消える。 感情や関係性は、“説明”されるより、“感じさせる”方が強く伝わります。 直接言い切るより、視線や距離感、仕草で見せる。 “語る”より“映す”。それが構図です。

CONFLICT 04

情報量の衝突

背景要素を詰め込みすぎる

→ 画面に呼吸感がなくなる。 情報量が多すぎると、観る人の視線がどこにも定着しません。 余白がないと、“何を見せたい画像なのか”がぼやけてしまいます。 良い構図には、必ず“見せない空間”も含まれています。

— PART FOUR —

4ステップ改善ループ

AI画像の改善は、基本的にすべてこの4ステップで進みます。 そして重要なのは、“順番”です。 途中を飛ばすと、次の工程がほぼ確実に崩れます。

▸ THE LOOP

01 SET TONE — まず、「何を表現したいのか」を決める。

02 FIND CONFLICT — 次に、どこで指示同士が衝突しているかを探す。

03 RESTRATEGIZE — 衝突している指示を、別のアプローチへ置き換える。

04 STRENGTHEN — 最後に、空気感や演出を加えて強化する。

多くの人がやってしまう失敗は、いきなりSTEP 04から始めることです。 cinematic lighting,8k,masterpiece,beautiful……そういった演出タグを大量に追加して、「なぜ良くならないんだろう?」となる。 ですが、仕上げは“構造”を直してくれません。 土台が崩れている画像に、どれだけ磨きをかけても意味はないのです。 では実際に、この4ステップがどのように機能するのか。3つの実例で見ていきましょう。

CASE STUDY № 01

屋上での遭遇シーン

意図:「静かな屋上でのひととき。 “誰かがそこにいる”と感じる空気感。」。

屋上シーン初回試行 — 寄りかかる動作と全身衣装の表示の矛盾でポーズが歪む

▸ TAKE 01 — DRAFT

FIND CONFLICT

最初の問題は、不自然なポーズでした。 狙っていたのは: ・手すりにもたれる ・遠くを見る ・横向き構図 による、“静かな存在感”。 ですが同時に、全身コーデも頭から足までしっかり見せようとしていました。 モデルは両方を満たそうとして、結果として身体がねじれた不自然なポーズになってしまった。典型的な「動作衝突」です。

RESTRATEGIZE — ポーズ修正

完全にもたれさせるのをやめる。代わりに、“手を軽く手すりに置く”程度へ変更。さらに、上半身中心の構図へ寄せ、衣装タグへの依存も少し弱める。これでポーズ自体は安定しました。 ですが今度は、視線が顔から外れ、“存在感”が弱くなってしまった。

屋上シーン修正 — ポーズは安定したが視覚中心が顔から外れて感情が弱まった

▸ TAKE 02 — REVISED

屋上シーン 3 回目 — 正面フレーミングで顔のフォーカスを取り戻す

▸ TAKE 03 — FACING FRONT

RESTRATEGIZE — 構図修正

もし本当に見せたいのが“キャラクターの感情”なら、横向き構図はやめるべきです。 そこで、正面寄りの中央構図へ変更。すると、表情が再び画面の中心へ戻り、感情が読み取れるようになりました。

STRENGTHEN — 最後に空気感を追加

ここで初めて 、演出を加えます。 floating hair → 静止感を崩し、自然な動きを加える。 backlight → 光に奥行きを与え、背後の街にも重みを出す。 構図自体は変わっていません。でも、“空気”が生まれました。

屋上シーン最終 — 安定した構図に floating hair と backlight で雰囲気を追加

▸ TAKE 04 — FINAL

このケースで必要だったのは、“別のプロンプト”ではありません。必要だったのは、「何を見せたいのか」を優先し、矛盾する指示を削ぎ落とすこと。空気感の演出は、土台が安定したあとに初めて意味を持ちます。

CASE STUDY № 02

地雷系ミオが、セーラーミオのパズルを完成させるシーン

意図: 「地雷系ミオが、セーラーミオのパズルを組み立てている。全体の空気感は、夢のようで、おとぎ話のように。」

SET TONE — まず“世界観”を決める最初にやるべきは、“夢っぽさ”や“童話感”を最初から持っているベーススタイルを探すこと。 複数の候補を比較した結果、選ばれたのは lucid dreamy 系。 柔らかく、幻想的で、空気が軽い。この時点で、作品全体のトーンが固定されました。

ミオパズルスタイル試行 1 — lucid dreamy 美学テスト

lucid dreamy

ミオパズルスタイル試行 2 — classic japanese 美学テスト

classic japanese

ミオパズルスタイル試行 3 — luminous impasto 美学テスト

luminous impasto

3 つともに夢のような意図に合う。柔らかく幽玄な質感の “lucid dreamy” を最終選択。トーンが固定されました。

ミオパズル イテレーション 1 — 体の比率が露出しすぎ、視線が直接的すぎる初回試行

▸ ITERATION 01

FIND CONFLICT — 情報が“説明的すぎる”

問題は、セーラーミオの情報量が多すぎたこと。 身体を見せすぎていて、視線が画面全体へ散ってしまう。 さらに、地雷系ミオとセーラーミオが“見つめ合う”構図も、感情を直接説明しすぎていました。 ただ二人が見つめているだけ。そこに、“想像する余白”がない。

RESTRATEGIZE — “内省ショット”へ切り替える

ここで、直接的なアイコンタクトをやめます。 映画には、内省ショットという演出があります。キャラクターが外界と視線を合わせず、自分の内側へ沈むことで、静けさや物語性を生む構図です。 セーラーミオを完全な横顔へ変更。(構図中心は維持)目を閉じ、手を胸元へ。このポーズには、派手な動きはありません。でも、静かかだからこそ、優しさが伝わる。“説明しない感情”が生まれます。目を閉じて手は胸に。

ミオパズル イテレーション 2 — 横向きで目を閉じた内省的な静寂

▸ ITERATION 02

ミオパズル最終 — 花、柔らかなボケ背景、優しい光でおとぎ話を完成

▸ FINAL — STRENGTHENED

STRENGTHEN — 空気感を加える

次に問題になったのは背景。 童話感を出したいのに、背景が少しシンプルすぎる。そこで花、草原を追加。 ですが今度は、背景情報が増えすぎて密度衝突が発生しました。 前景と背景が競合し、視線が落ち着かない。

解決策soft bokeh effect 周囲の花を soft bokeh effect でぼかします。 すると、余白が戻る。視線がキャラクターへ集中する。さらにライティングも柔らかく調整。 これで、“夢の中のような空気感”が完成しました。

CASE STUDY № 03 · QUICK PASS

花火大会シーン

意図:「花火大会で過ごす二人。胸がきゅっとなるような、恋愛感のある瞬間。」

ここでは、改善ループを素早く回していきます。tone → conflict → restrategy → strengthen。この流れは同じです。

花火大会シーン初回イテレーション — ロマンチックな意図に対して原版のムードが距離を持ちすぎる

▸ TAKE 01 · トーン設定

まず、 dreamy / shoujo 系スタイルへ変更。 ですが、構図が広すぎる。感情を“顔”へ乗せたいのに、視線が顔へ集まっていません。 衝突: 「感情を見せたい」のに、「画面が広すぎる」。

花火大会シーン 2 回目 — face focus 追加、フレーム強化

▸ TAKE 02 · 構図修正

地雷ミオスカート描写を削減。さらに、face focus を追加。 カメラが、“二人の間に流れる空気”へ集中し始めます。 ですが今度は、花火大会らしさが薄れてきました。背景の人物が、“お祭りの来場者”として認識されなくなっている。

花火大会最終 — 一方を着物に変更して祭りの文脈を復元、頬を赤らめさせて感情を強化

▸ TAKE 03 · 空気感強化

セーラーミオの衣装を浴衣へ変更。これで、花火大会という文脈が復活。 さらに:blush、より強めの表情タグを追加。 すると、“胸が高鳴る感じ”が、しっかり顔へ乗るようになりました。

ここでも流れは同じです。tone → conflict → restrategy → details。ケースがシンプルになっても、改善の順番そのものは変わりません。

今度は、自分で”シーン”を演出しよう

毎日無料クレジットで、今すぐ創作を始める

PixAIを無料で体験

クレカ不要・毎日無料クレジット

— PART FIVE —

構図で迷った時の、3つの原則

もしショット理論や衝突パターンを全部忘れてしまっても、この3つだけは覚えておいてください。

1. 設定より、“空気感”を優先する

キャラクターの衣装設定が、作品の感情や雰囲気と衝突するなら、削るべきは衣装設定の方です。 すべての要素は、“表現したい感情”のために存在します。 最初は重要だと思っていたディテールでも、空気感を壊すなら手放す。迷った時は、“トーンに貢献していない情報”を削ってください。

2. 視線の中心は、絶対に迷わせない

観る人の視線が最初に落ちる場所。 そこには、“もっとも見せたいもの”が存在していなければいけません。 もし探さないと見つからないなら、その時点で構図は負けています。この“視線誘導”を決めるのが構図。そして、それを強化するのが光です。(ライティングについてはPart 5で詳しく扱います)

3. “余白”を恐れない

シーンは、“見る”だけでなく、 “感じる” ための空間でもあります。 背景ボケ。シンプルな構図。整理された前景。これらは単なるミニマルデザインではありません。感情を伝えるための選択です。 画面を情報で埋め尽くすと、感情は平坦になります。余白があるからこそ、空気が生まれます。

— FAQ —

よくある質問

ショット指定は、プロンプトの最初と最後どちらに書くべき?

前半です。 基本的には、主体指定のすぐ後。PixAIのモデルは、前に書かれた情報ほど重要視する傾向があります。 つまり:1girl, wide shot, ... …のように書くことで、モデルは“まず構図を決めてから”他の要素を組み立てます。 逆に最後へ置くと、構図が“後付け情報”になってしまいます。

ポーズが毎回崩れる。モデルが悪い?

ほとんどの場合、原因は「動作衝突(Conflict 01)」です。 プロンプトを見直してみてください。 ・特定ポーズ ・衣装を全身見せたい ・特定構図 これらを同時に要求していませんか? まず1つ削ってみましょう。それでポーズが安定するなら、原因は衝突です。 それでも崩れる場合は、ベースモデル自体の人体理解力が弱い可能性があります。 より解剖学に強いモデルへ変更してみましょう。

ワイドショットとクローズアップ、どう使い分ける?

まず自分へ問いかけてください。 「この画像は、 “どこ” を見せたいのか?」それとも「“誰”を見せたいのか?」ワイドショットは、“場所”のため。 屋上、街並み、森など、シーン全体を伝えたい時に使います。 クローズアップは、“人物”のため。 感情、視線、恋愛感情、リアクション。キャラクターの内面を見せたい時に使います。 もし答えが「両方同じくらい重要」なら、medium shot がちょうど良いことが多いです。

構図って難しすぎる。とりあえず生成して後で直せばいい?

もちろん可能です。 ただ、その方法だと大量の生成回数を消費します。 実際には、生成前に2分だけ“画面を想像する”方が、「あと少し違う…」を10回繰り返すより圧倒的に効率的です。 AIアートにおいて、もっとも大きな差が生まれるのは“構図設計”です。 そこが、一番リターンの大きい思考ポイントなんです。

SCENE 04 // CUT
FADE OUT —

— THAT’S A WRAP —

今度は、自分で“シーン”を演出しよう

まず、空気感を決める。画面を想像する。衝突を見つける。構図を組み直す。そして最後に、演出で磨き上げる。 それが、AIアート構図のすべてです。そしてそれこそが、“ただ生成された画像”と、“意図を持って構成された一枚”を分ける違いになります。

▸ PixAIを開く

シリーズを続ける

PART 1|入門編

モデル vs LoRA 基礎編 →

すべてのAI画像を支える、2つの基本要素。

PART 2|入門編

PixAIプロンプト公式 →

“ちゃんと効くプロンプト”を書くための、6ステップ構成。

PART 3|入門編

LoRAスタッキングガイド →

不足している要素を見極め、適切なLoRAを重ねて改善する方法。

PART 5|達人編

シネマティックライティング&奥行き表現 →

10種類のライティング、色彩理論、被写界深度を解説。

Index