AIイラスト生成において、キャラクターのデザインや画風以上にクオリティを左右する要素が「構図(コンポジション)」と「カメラアングル」です。プロンプトで「かわいい女の子」と入力するだけでは、AIは無難な証明写真のような正面図ばかりを出力しがちです。
視線を誘導し、物語性を感じさせる一枚を生成するためには、カメラの位置、レンズの特性、そして被写体との距離感を正確に言語化する必要があります。また、言葉だけでは伝えきれない複雑な構図を再現するための「画像参照(Image-to-Image / ControlNet)」技術の理解も不可欠です。
本記事では、Stable DiffusionやMidjourneyなどで即戦力となる構図指定プロンプトを体系的に網羅し、意図通りのレイアウトを実現するためのリファレンス活用術を徹底解説します。
カメラアングルと視点の基本プロンプト
まずは、カメラが被写体を「どこから見ているか」を指定するアングル系のプロンプトです。これらを冒頭に追加するだけで、画像の印象は劇的に変化します。
視点の高さをコントロールする
カメラの垂直位置を指定することで、キャラクターの力関係や心理描写を演出できます。
- High angle / From above:
- 俯瞰(ふかん)。 上から見下ろす構図です。被写体の可愛らしさ、儚さ、あるいは状況の広がりを表現するのに適しています。背景の床や地面の情報量が増えます。
- Low angle / From below:
- あおり。 下から見上げる構図です。キャラクターの威厳、迫力、脚の長さを強調します。巨大な建築物や空を背景に入れる際に有効です。
- Eye level / Eye contact:
- 目線の高さ。 最も標準的なアングルです。親近感や対等な関係性を表現します。ポートレートとして安定感があります。
- Overhead shot / Bird’s eye view:
- 真上からの視点。 High angleよりもさらに高い、真上からのショットです。寝転がっている構図や、配置図のようなデザイン的なイラストに適しています。
- Worm’s eye view:
- 地面スレスレの視点。 Low angleの極端な形式です。靴や地面の質感を強調し、圧倒的な巨大感を演出します。
カメラの傾きと特殊な視点
水平を崩したり、特殊な場所から撮影したりすることで、動的な印象を与えます。
- Dutch angle / Tilted frame:
- ダッチアングル(斜め構図)。 カメラを意図的に傾ける手法です。不安感、疾走感、アクションシーンの緊迫感を演出します。単調な立ち絵を一気にドラマチックにします。
- Selfie:
- 自撮り。 スマートフォンを持った手が画面端に見切れるような、プライベート感のある構図です。
- Pov (Point of View):
- 主観視点。 「誰か(あるいは何か)の視点」であることを示します。
pov, looking at viewerと組み合わせることで、鑑賞者と目が合っている状況を作れます。 - From behind:
- 後ろ姿。 キャラクターの背中越しに世界を見せる構図です。顔が見えない分、背中で語る哀愁や、これから向かう先の壮大さを表現できます。
ショットサイズ(被写体の大きさ)の指定
画面内に被写体を「どれくらいの大きさ」で収めるかを指定するプロンプトです。これを指定しないと、AIは勝手に頭頂部を切ったり、膝下でトリミングしたりする傾向があります。
基本的なショットサイズ一覧
| プロンプト | 日本語訳 | 特徴・用途 |
| Extreme close-up | 超アップ | 目や唇など、パーツを画面いっぱいに映す。感情の強調。 |
| Close-up | アップ | 頭から肩まで。表情をしっかりと見せたい場合に最適。 |
| Portrait | バストアップ | 胸から上。肖像画やアイコン作成の標準サイズ。 |
| Upper body | 上半身 | 腰から上。手の動きやポーズを含められる。 |
| Cowboy shot | 膝上 | 太ももから上。武器を持ったり、服装を見せるのに適したバランス。 |
| Full body | 全身 | 足先まで含める。衣装デザインやプロポーションの提示に必須。 |
| Wide shot | 引きの画 | 人物を小さくし、周囲の風景や状況説明を優先する。 |
注意点:
Full bodyを指定しても足が切れる場合は、画像の縦横比(アスペクト比)を縦長(例: 2:3や9:16)に変更することで解決しやすくなります。横長の画像で全身を入れると、キャラクターが豆粒のように小さくなるか、座りポーズになりがちです。
画面構成を整える「構図テクニック」プロンプト
写真や絵画で用いられる伝統的な構図法をプロンプトとして入力することで、AIに美的センスを強制できます。
安定感と美しさを生む構図
- Rule of thirds:
- 三分割法。 画面を縦横に三等分し、その交点に主題を配置する基本テクニックです。バランスが良く、素人っぽさが消えます。
- Golden ratio:
- 黄金比。 螺旋状の構図などを意識させ、視覚的に最も美しいとされる比率で画面を構成します。神秘的で芸術的な雰囲気が増します。
- Symmetrical composition / Symmetry:
- 左右対称。 画面の中央にキャラクターを配置し、左右のバランスを完璧に整えます。神聖さ、威厳、幾何学的な美しさを表現するのに向いています。
- Centered:
- 中央配置。 シンプルに被写体を真ん中に置きます。日の丸構図とも呼ばれ、被写体の存在感をストレートに伝えます。
空間と奥行きを操るプロンプト
- Negative space:
- 余白。 あえて被写体のない空間(空、壁、闇など)を広く取ります。孤独感や静寂、デザイン的な抜け感を演出します。文字を入れるスペースを作りたい場合にも有効です。
- Depth of field / Bokeh:
- 被写界深度・ボケ。 背景をぼかして被写体を際立たせます。一眼レフカメラで撮影したようなリッチな質感になります。
- Perspective / Vanishing point:
- 遠近法・消失点。 建物や道路などが奥に向かって収束していく様子を描写します。画面に強烈な奥行きを与えます。
躍動感を生み出す「パース」と「動き」の指定
静止画でありながら、動きや立体感を感じさせるための高度なプロンプトです。アクションイラストやダイナミックなポーズには必須です。
3D的な歪みを加える「Foreshortening」
Foreshortening(短縮法) は、AIイラストにおいて最強の構図プロンプトの一つです。
カメラに近い手や足を極端に大きく、遠い部分を小さく描く技法です。こちらに向かって手を伸ばしている構図や、蹴り技を繰り出している構図などで、圧倒的な迫力を生み出します。
Reaching towards viewer(こちらに手を伸ばす)Kicking towards viewer(こちらに蹴りを放つ)
これらと組み合わせることで、画面から飛び出してくるような効果が得られます。
レンズ効果による演出
カメラレンズの特性を指定することで、空間の歪みをコントロールします。
- Fish-eye lens:
- 魚眼レンズ。 画面の中心を膨張させ、周辺を歪ませます。コミカルな表現や、狭い部屋を広く見せる際、あるいはサイケデリックな演出に使えます。
- Telephoto lens:
- 望遠レンズ。 背景を引き寄せ、圧縮効果を生みます。被写体と背景の距離感を縮め、密度のある画面を作ります。
- Wide angle lens:
- 広角レンズ。 広い範囲を写し込み、パースを強調します。広大な風景の中にキャラクターがいる状況に適しています。
ControlNetを活用した「構図の強制指定」
プロンプト(言葉)だけで複雑な構図を完全に制御するのは困難です。「手が重なっている」「特定のポーズで絡み合っている」といった指定は、AIにとって難易度が高いからです。そこで、ControlNet(Stable Diffusionの拡張機能)などの参照技術を使用します。
OpenPose(骨格指定)
既存の画像や、デッサン人形アプリで作ったポーズ画像から「骨格情報(棒人間)」だけを抽出し、それを元にAIイラストを生成します。
- メリット: プロンプトでは表現しきれない複雑なポーズ(座禅、格闘、二人組のポーズなど)を確実に再現できます。
- 活用法: 「DesignDoll」などの3Dデッサンソフトで構図を決め、それをOpenPoseに読み込ませるのが鉄板のワークフローです。
Depth / Normal / Canny(深度・法線・線画)
元画像の「奥行き情報」や「輪郭線」を抽出して参照します。
- Depth: 手前にあるものと奥にあるものの関係性を維持します。背景の構造を維持したい場合に有効です。
- Canny / Lineart: 元画像の線画を抽出し、構図をそのままに色塗りやテイストだけを変えることができます。ラフ画を描いてAIに清書させる場合に最適です。
Reference Only / IP-Adapter
画像の「雰囲気」や「構図のバランス」だけを緩やかに参照させます。
明確なポーズ指定まではしたくないが、元画像の持つ「なんとなく良い構図」を借りたい場合に使用します。スタイルの統一にも役立ちます。
トラブルシューティング:構図が崩れる時の対処法
プロンプトを入れても反映されない、身体の一部が破綻するといった問題への具体的な解決策を解説します。
頭や足が見切れてしまう場合
「全身(Full body)」を指定しているのに頭が切れる(Head out of frame)現象は頻発します。
- 対策1: ネガティブプロンプトに
out of frame,cropped,cut offを強力に入れる。 - 対策2: 縦長の解像度(512×768など)に設定する。
- 対策3:
zoom out(ズームアウト)というプロンプトを追加し、カメラを引かせる。
背景とキャラクターのパースが合っていない
キャラクターは書き込まれているが、背景の遠近感がおかしく、浮いているように見える場合です。
- 対策:
detailed background(詳細な背景)に加え、sceneryや具体的な場所(classroom, streetなど)を詳しく記述し、AIに空間を認識させます。ControlNetのDepthを使用すると、空間整合性が向上します。
構図が単調でつまらない
正面棒立ち(A-pose / T-pose)ばかり出力される場合です。
- 対策:
dynamic pose(動的なポーズ)、action shot(アクションショット)、wind(風)などの動きを示唆する単語を入れます。また、アングルをDutch angleにするだけで、画面に緊張感が生まれます。
AIイラスト 構図 参考に関するよくある質問
既存のイラストを読み込ませて構図を真似るのは著作権的に問題ない?
画像生成AIの「Image-to-Image(i2i)」やControlNet機能を使って、他者の著作物を読み込ませ、構図やポーズを酷似させた画像を生成・公開することは、著作権侵害(依拠性)のリスクを伴います。完全に一致するトレスのような生成は避け、あくまで3Dデッサン人形や自分で撮影した写真、著作権フリーの素材写真をリファレンス(参照元)として使用することが安全かつ推奨される運用方法です。
プロンプトの順番は構図に影響しますか?
はい、大きく影響します。Stable DiffusionなどのAIモデルは、プロンプトの先頭にある単語ほど重要度を高く認識する傾向があります。構図を最優先したい場合は、Low angle, Full body shot of a girl... のように、キャラクターの描写よりも先に構図指定を配置するか、(Low angle:1.3) のように重み付け(強調)を行うことで、反映率を高めることができます。
スマホのAI生成アプリでも構図指定は有効ですか?
「niji・journey(ニジジャーニー)」や「Bing Image Creator」などのスマホアプリやWebサービスでも、本記事で紹介したプロンプト(High angle, Close-upなど)は有効です。ただし、ControlNetのような高度な参照機能は使えない場合が多いため、プロンプトによる言語化能力がより重要になります。
まとめ
AIイラストのクオリティをプロ級に引き上げる鍵は、詳細なプロンプトによる「カメラワークの演出」と、ツールによる「構図の強制」にあります。
- アングルの言語化:
High angleLow angleDutch angleを使い分け、心理描写を行う。 - 距離感の指定:
Close-upやFull bodyで、見せたい情報の優先順位を決める。 - パースの活用:
ForeshorteningやPerspectiveで、2次元の画像に3次元的な深みを与える。 - 外部ツールの併用: 複雑な構図はプロンプトで粘らず、ControlNet(OpenPose等)やデッサン人形ソフトを活用して骨格を指定する。
「どのような絵を描きたいか」だけでなく、「カメラマンとしてどう撮りたいか」という視点を持つことで、AIイラストの表現力は無限に広がります。まずは基本の三分割法やアングル指定から試し、徐々に自分だけの構図パターンを確立してください。
