PixAIで始めるDiT LoRA学習|2026年完全ガイド
PixAIでDiT LoRAを学習する方法を完全解説。DiT.1(Tsubaki)とDiT.2(Tsubaki.2)の違い、学習時間、トリガーワード、データセット要件まで初心者向けに紹介します。
DiT LoRA学習は、PixAIで独自のキャラクターやスタイルを作るための最も強力な手段になりました。DiT.1と新世代のDiT.2の両方に対応しており、PixAIの主要なDiTベースモデルを使って自分だけのLoRAを学習できます。本記事では、DiT LoRA学習を始める前に押さえておきたいポイント——どのDiTモデルが用意されているか、どのモデルが学習ベースとして選べるか、学習時間の目安、DiT.1とDiT.2で大きく異なるトリガーワードのルール、推奨されるデータセット仕様、そして初心者がつまずきやすい落とし穴——を順を追って解説していきます。
目次
なぜDiT LoRA学習がSDXLより優れているのか
SDXLベースのモデルで2人以上のキャラクターを生成すると、しばしば「特徴ブレンディング」と呼ばれる現象に悩まされます。顔・髪・衣装といった視覚的な特徴がキャラ間で混ざってしまう問題で、3人以上を画面内に配置するとさらに顕著になります。
一方、DiTベースのアーキテクチャは複数キャラクターの構図を圧倒的に安定して扱えます。各キャラクターの特徴がきちんと保持され、キャラ同士の距離感やインタラクションも自然になり、視線・身振り・重なり合いまで一貫した表現が可能です。複数キャラのシーンに耐えられるLoRAを作りたい場合、あるいは単に最新のベースモデル品質を活用したい場合、DiT LoRA学習が現在のPixAIにおける最適解です。
PixAIで利用可能なDiTモデル一覧
PixAIには現在、2世代のDiTアーキテクチャがあります——DiT.1(初代アーキテクチャ)とDiT.2(新世代アーキテクチャ)です。利用可能なDiTベースモデルを順に紹介します。
DiT.1モデル
👉 DiTベースのモデル:

- 自然言語プロンプトに対応(タグは任意): 日常的な文章でイメージを生成でき、タグの入力は必須ではありません
- 高品質な多人数生成(間隔、相互作用、バランス)
- キャラクター同士の相互作用の向上(視線、ジェスチャー、重なり)
LoRA 訓練のコツを学んだら、PixAI で実践
PixAIで LoRA を作るDiT.2モデル
Tsubaki.2 — PixAI最新のフラッグシップDiT.2モデル。生成品質とプロンプト理解力がDiT.1ラインから大きく向上しています。
LoRA 訓練のコツを学んだら、PixAI で実践
PixAIで LoRA を作るDiT LoRA学習に対応しているのはどのモデルか?
すべてのDiTベースモデルが学習ベースとして使えるわけではありません。2026年現在、PixAIのDiT LoRA学習が対応しているのは次の2モデルだけです:
- Tsubaki(DiT.1)
- Tsubaki.2(DiT.2)
それ以外のDiTモデル——Tsubaki v1.1、Tsubaki Flash、Serin——は生成には使えますが、LoRA学習画面ではベースモデルとして選択できません。
ただし「学習ベースとして選べる」ことと「LoRAが動くベースモデル」は別の話です。Tsubakiで学習したLoRAはTsubaki Flashとの推論互換性が高いため、TsubakiがDiT.1の標準的な学習ベースとして機能している、という構造になっています。1回学習すれば互換性のある複数のベースモデルで使える、というわけです。
⚠️ 重要:Tsubaki.2は他モデルと互換性がありません Tsubaki.2は独立したベースモデルです。Tsubaki、Tsubaki v1.1、Tsubaki Flash、Serin、その他いずれのモデルで学習したLoRAも、Tsubaki.2では動作しません。Tsubaki.2でLoRAを使いたい場合は、必ずTsubaki.2をベースモデルとして指定して学習し直してください。
すでにTsubakiで成功しているLoRAがあり、同じコンセプトをTsubaki.2に持っていきたい場合は、PixAIの既存データを使う機能で数クリックで再学習できます。データセットを変更せずに再利用する場合は、学習料金が自動で50%OFFになります。詳しい操作手順は マルチバージョンLoRAとデータセット再利用ガイド をご覧ください。
DiT LoRA学習にかかる時間の目安
DiT LoRA学習は、アーキテクチャが重い分、従来のSDXL学習よりも時間がかかります。目安は次の通りです:
- Tsubaki(DiT.1)のLoRA学習: 1回あたり約70分
- Tsubaki.2(DiT.2)のLoRA学習: 1回あたり約2時間
学習タスクの一覧に表示される推定時間はあくまで目安で、キュー混雑状況やデータセットのサイズによって変動します。特に学習開始直後の推定値は精度が低めです。完了を待つ間は、ページをリロードし続けるよりも、タスクを投入したら一旦離れるほうが現実的です。
DiT LoRA学習でのトリガーワードのコツ
PixAIのDiT LoRA学習では、トリガーワードの考え方が古いSDXLワークフローのカンマ区切りタグとは違います。さらにDiT.1とDiT.2でルールそのものが異なるため、初心者が最もつまずきやすいポイントです。
Tsubaki LoRA(DiT.1)のトリガーワード
Tsubakiでの学習では、トリガーワードは簡潔かつ要点を絞るのが基本です。
キャラクターLoRA — 次の形式に従ってください:
character_name, source_work, other_attributes
例:hatsune_miku, vocaloid, twin_tails
スタイル・コンセプトLoRA — データセット全体に共通する核となる特徴に絞ります。
例:ink_wash_style
DiT.1での一般的なガイドライン:
- トリガーワードは短く具体的に
- 長く複雑な記述句は避ける
- データセットのすべての画像に共通する、最も本質的な特徴を1点に絞る
Tsubaki.2 LoRA(DiT.2)のトリガーワード
Tsubaki.2では、簡潔さのルールが逆転します。Tsubaki.2のLoRA学習では、最低でも30文字以上の、対象の核となる特徴を詳細に記述したトリガーワードを推奨しています。トリガーフレーズの情報量が多いほど、Tsubaki.2は学習中にコンセプトをしっかり捉えてくれます。
良いTsubaki.2のトリガーフレーズは、単なる名前ではなく、対象を識別できる視覚的特徴を簡潔に並べた「特徴の名刺」のようなものです。トリガーワードが30文字に届いていない場合、それだけで学習品質を取りこぼしている可能性があります。
DiT LoRA学習に推奨されるデータセット仕様
学習ベースがTsubakiでもTsubaki.2でも、データセットのルールは共通です。
画像枚数
DiT LoRA学習に最適なのは30〜100枚です。30枚を下回ると汎化が効かず、100枚を超えると学習時間が伸びるばかりで品質向上はそれほど見込めません。
画像の品質と一貫性
- すべての画像が、学習させたい共通特徴(同じキャラクター、同じスタイル、同じコンセプト)を共有していること
- できる限り画像サイズを揃えること
- テーマ性・スタイル性に明確な統一感を持たせること——統一感のないデータセットからは、統一感のないLoRAしか生まれません
既存データセットを再利用する場合
PixAIですでにLoRAを学習したことがある場合、たとえば古いTsubakiコンセプトをTsubaki.2に移植したいときや、別の学習設定を試したいときには、既存のデータセットをそのまま再利用できます。データセットを変更せずに再学習すれば、学習料金が自動で50%OFFになります。詳しい手順は マルチバージョンLoRAとデータセット再利用ガイド で解説しています。
初めてのDiT LoRA学習を始める手順
- PixAIの LoRA学習ページ にアクセスします。
- モデルタイプ で DiT.2(Tsubaki.2で学習する場合)または DiT.1(Tsubakiで学習する場合)を選択します。
- モデルテーマ で具体的なベースモデルを確認します——DiT.1ならTsubaki、DiT.2ならTsubaki.2です。
- 30〜100枚のデータセットをアップロードします。
- 上記のルールに従ってトリガーワードを設定します(Tsubakiは簡潔に、Tsubaki.2は30文字以上で詳細に)。
- 送信して待機します。Tsubakiで約70分、Tsubaki.2で約2時間が目安です。
DiT LoRA学習のよくある質問(FAQ)
DiT LoRA学習に対応しているモデルは?
2026年現在、PixAIのDiT LoRA学習が対応しているのはTsubaki(DiT.1)とTsubaki.2(DiT.2)の2モデルです。Tsubaki v1.1、Tsubaki Flash、Serinといった他のDiTモデルは生成には使えますが、LoRA学習画面ではベースモデルとして選択できません。
DiT.1とDiT.2の違いは?
DiT.1はPixAI初代のDiT世代で、学習ベースとなるTsubakiのほか、生成専用のTsubaki v1.1、Tsubaki Flash、Serinが含まれます。DiT.2は新世代アーキテクチャで、現在Tsubaki.2を支えています。DiT.2は生成品質が高い反面、学習時間が長く、トリガーワードの書き方もDiT.1とは異なります。
DiT LoRA学習にはどれくらい時間がかかる?
Tsubaki(DiT.1)のLoRA学習は1回あたり約70分、Tsubaki.2(DiT.2)のLoRA学習は約2時間が目安です。学習タスクに表示される時間は推定値で、システムの混雑状況により前後します。
TsubakiのLoRAはTsubaki Flashで使える?
はい。Tsubaki FlashはオリジナルのTsubakiで学習したLoRAとの互換性が高いように設計されているため、Tsubakiで学習した1つのLoRAを両方のベースモデルで問題なく使えます。これは推論時の互換性の話で、学習ベースとしての互換性とは別問題です——Tsubaki.2については互換性がない点にご注意ください。
TsubakiのLoRAはTsubaki.2で使える?
いいえ。Tsubaki.2は独立したベースモデルで、Tsubakiを含めた他のいずれのモデルで学習したLoRAも動作しません。Tsubaki.2で使うには、Tsubaki.2を学習ベースとして指定し直す必要があります。既存データを使う機能を活用すれば、再学習も短時間で済み、料金も50%OFFになります。
Tsubaki.2のトリガーワードは何文字必要?
Tsubaki.2のLoRA学習では、対象の核となる特徴を詳細に記述した30文字以上のトリガーワードを推奨しています。Tsubaki(DiT.1)で使われていた短いカンマ区切りのトリガーワードとは大きく方針が変わっています。
DiT LoRA学習に必要な画像枚数は?
TsubakiでもTsubaki.2でも、推奨される画像枚数は30〜100枚です。品質・サイズの一貫性を保ち、データセット全体でテーマやスタイルに明確な統一感があることが重要です。
今すぐDiT LoRA学習を始めよう
TsubakiとTsubaki.2、どちらのDiT LoRA学習も現在PixAIで利用できます。作りたい絵柄に合うベースモデルを選び、その世代に応じたトリガーワードのルールに従えば、すぐに学習を始められます。



