初心者が「4コマ漫画」を自作してみた！制作時間3時間の全工程を公開

2026年2月8日 2026年3月24日

総　賢司

ー Information ー

この記事はこんな人向け: AIチャットの枠を超えて、自分の手で形あるコンテンツを作ってみたいクリエイティブ志向の初心者の方。
この記事で学べること: 生成AI（Gemini）を活用し、キャラクター設定からプロンプトの仕組み化、最終仕上げまでを3時間で完結させる実践的なフロー。
目安読了時間: 約4分

Contents

「AIを使える」から「AIで作れる」へ。文系初心者が挑むクリエイティブの壁
まとめ

「AIを使える」から「AIで作れる」へ。文系初心者が挑むクリエイティブの壁

AIを本格的に使い始めて1ヶ月半。
GeminiやGoogle AI Studio、Colabといったツールを触る中で、「もっと新しい、形になることに挑戦したい」という欲求が湧いてきました。

そこで今回挑戦したのが、「AIによる4コマ漫画制作」です。

絵心がまったくない文系の私でも、AIの力を借りれば漫画家になれるのか？
試行錯誤のプロセスを包み隠さず公開します。

著作権の壁を越え、ボクセルアートで「自分だけ」のキャラクターを召喚する

漫画の命とも言えるキャラクター作りには、細心の注意を払いました。

既存のキャラクターを模倣せず、オリジナリティと著作権のクリーンさを両立させるため、以下のステップを踏んでいます。

自分の写真をベースに
プロンプトの抽出に自分の写真を利用。
　
ボクセルアートの採用
3Dピクセル（積み木）のようなスタイルにすることで、独自性を確保。
　
三面図の生成
キャラクターの整合性を保つため、正面・横・後ろの図もあらかじめ用意。

出来上がりがこちらです。

ちなみにキャラ生成はGeminiのNanoBnanana Proを採用。
お願いしたプロンプトの指示文はこのような感じでした。

【AIへの指示（プロンプト）】

4コマ漫画を作るのでキャラクターのプロンプトを考えてください
なお著作権の問題があるので固有名詞は使わないでください

・3頭身のちびキャラ（男）
・黒髪短髪
・目はブラウン
・基本笑顔
・体型はいたって普通
・服装　上：オレンジ色のタートルネックの長袖　下：黒いクロップドパンツ
・靴下は緑
・アニメ塗りのフルカラー
・かっこいいよりもかわいい系に

あわせて、背景も「アニメ調の自室」として固定画像を作成。

【AIへの指示（プロンプト）】

一般的な部屋の画像のプロンプトをください

絶対欲しいもの
・ベッド
・机、いす
・机の上のノートパソコンとスタンドライト、小物
・窓とカーテン
・壁に装飾

役者と舞台をあらかじめ定義しておくことが、AI漫画制作の第一歩です。

脚本を渡すだけで「呪文」が躍り出る！YAML形式が生んだ驚きの生成体験

さて、ここからが今回のハイライトです。

まず漫画のキャラだけを作成しましたが、いちいちキャラを添付して毎回「1コマ目は右上にAさんがいて・・・」と手打ちするのは面倒。

このやり方だと指示漏れも起きやすい。

そこで、「AIに漫画の脚本を渡したら、自動で画像生成用のプロンプトに変換してくれるシステム」を先に作ります。

一般的にはこれを「プロンプト作成用プロンプト」と呼ぶみたいですね（自分調べ）。

魔法のフォーマット「YAML」とは？

ここでAIへの指示出しに使うのが「YAML（ヤムル）」という書き方です。
これがめちゃくちゃ便利。

普通、文章で4コマ漫画の指示を書くとこうなります。

「1コマ目は学校で、Aさんが笑っていて、右上に配置してセリフが・・・、背景が・・・」

これが4コマ分ずっと続くので、さすがのAIも「文章が長くてどこが大事かわからん！」となってしまいます。
これをYAML形式にするとこうなります。

1コマ目:
場所: 学校
キャラ: Aさん
表情: 笑顔

→ AI「なるほど！【場所＝学校】ね。了解！」

このように「情報のセット」として渡すことで、AIの読み間違いが劇的に減ります。

プロンプト作成用プロンプト

早速AIにプロンプト作成用プロンプトを作ってもらいます。
私が最初にGeminiに提案したチャットの内容がこちら。

【AIへの指示（プロンプト）】

4コマ漫画を作るのですが、最終的な画像生成をGeminiにお任せするつもりです
準備はこれだけで足りているでしょうか

・キャラクター画像と三方図の画像
・背景の画像

【ネーム】（※セリフや画面構成などを決めます）

1 コマ目：Aさん（机の前に座りノートパソコンをマウスで操作している。表情は自然な笑顔、セリフは・・・）
2 コマ目：Aさん（実際は細かい指示が入ります）
3 コマ目：Aさん（実際は細かい指示が入ります）
4 コマ目：Aさん（実際は細かい指示が入ります）

【プロンプト出力の際の希望】
キャラクターの外見は設定に忠実に
コマの位置（top-left, top-right, bottom-left, bottom-right）を明記
背景は具体的に指定
セリフは自然な日本語で
4コマの起承転結を意識

【出力形式】以下の YAML 形式で英語で出力してください：
panels:- number: 1position: "top-left"
background: " 背景の説明 "
characters:- name: " キャラクター名 "
appearance: " 外見の特徴 "
position: " 画面内での位置 (left/center/right) "
expression: " 表情 "
pose: " ポーズ・動作 "
dialogue: " セリフ "

以上
これでGeminiにお願いするつもりです

このままコピペし、そのままGeminiに画像と一緒に送信すればOK。

送信すると、AIがこのプロンプトで指示文（システムプロンプト）」を構築して提示できることを確認。

ただ提示する前に、AIから追加で答えてほしいことが3つ返ってきました。
その内容が

セリフ（吹き出し）の処理方法
画像生成の単位（1枚絵 vs 4枚生成）
中間出力フォーマット（YAML）の最適化

について決めましょうというものでした。

セリフの入力はAIにとってかなり難しい要素。
4コマ分のセリフを1文字も間違えないで入力することは困難なようです。

これに対し私の回答は、　

空の吹き出しだけAIでつけて、文字は自分で挿入する方法にします。
　
今回は1枚で4コマを生成する方法でお願いします。
（1枚1コマにすればAIの精度もあがり、日本語入力も可能になるかも）
　
AIがしたいと言うならOK
（AIからの提案でYAMLの他に「画像生成AIに入力するための最適化された英語プロンプト（Image Prompts）」も同時に出力したい。とのことでした）

この内容再びAIに送信すると、なんともうプロンプト作成用プロンプトを作ってくれました。
長いですがノーカットで掲載します。

この指示書をコピーして、Gemini（私）に貼り付けるだけで、「脚本を渡すと、画像生成用の呪文（プロンプト）が返ってくる」という状態になります。

以下がその「特製指示プロンプト」です。

【コピー用】4コマ漫画プロンプト生成指示書

以下のテキストボックス内の内容をすべてコピーし、新しいチャット（またはこの続き）に貼り付けてください。
その後に「脚本」を入力すると、画像生成用のプロンプトが出力されます。

あなたはプロの「AI画像生成プロンプター」兼「4コマ漫画構成作家」です。
以下の【制約条件】と【キャラクター設定】に基づき、ユーザーが入力する脚本から、画像生成AI（Gemini/Imagen 3）に入力するための「英語プロンプト」と「構成YAML」を作成してください。

# 1. 画像生成のスタイル設定 (Style Guidelines)
* **画風:** Voxel Art, 3D Pixel Art style (Minecraft-like aesthetics but high quality). Cute, vibrant, rendered lighting.
* **形式:** A vertical 4-panel comic strip (one single image containing 4 panels arranged vertically).
* **吹き出し:** Include empty white speech bubbles in each panel for dialogue placement.
* **背景:** Pixel art style anime bedroom or specified location.

# 2. キャラクター設定 (Character Reference)
* **名前:** Aさん（主人公）
* **外見:** A cute voxel-style young man.
    * **髪:** Black short hair, blocky texture.
    * **服:** Orange long-sleeved shirt (plain), Black shorts.
    * **足元:** Green socks visible, Brown shoes.
    * **体型:** Chibi style, 2-head tall (SD character).

# 3. 出力プロセス
ユーザーから脚本（ネーム）が提供されたら、以下の2つを出力してください。

## 出力 A: 構成確認用 YAML
（ユーザー指定の形式: panels, number, position, background, characters, appearance, expression, pose, dialogue）

## 出力 B: 画像生成用プロンプト (Image Generation Prompt)
画像生成AIにそのまま貼り付けて「1枚の4コマ漫画」を生成するための英語プロンプトです。以下の構成で書いてください。
* **Subject:** A 4-panel comic strip featuring a voxel art character. Vertical layout.
* **Global Style:** Voxel art, 3D render, cute, 8-bit aesthetic, soft lighting, detailed pixel background.
* **Panel Description:**
    * **Panel 1 (Top):** [Description of action, expression, background] with an empty speech bubble.
    * **Panel 2:** [Description] with an empty speech bubble.
    * **Panel 3:** [Description] with an empty speech bubble.
    * **Panel 4 (Bottom):** [Description] with an empty speech bubble.
* **Negative Prompt推奨:** blurry, low quality, text inside bubble, messy text, extra fingers, distorted, realistic human, 2D anime (keep it voxel/3D pixel).

---
どうぞ、脚本（ネーム）を入力してください。

すごい。
数回のやり取りだけでここまでしれくれるとは。

これであとはプロンプトの最後にある『どうぞ、脚本（ネーム）を入力してください。』のところに脚本を書いてGeminiに渡すだけになりました。

AIの限界を「人力」でねじ伏せる。完璧を求めすぎて見えた「1枚出し」の落とし穴

早速プロンプト生成指示書をチャットにコピペし脚本を書いて、参考画像のキャラクターと背景を添付。

送信ボタンを押すと、

出力 A: 構成確認用 YAMLと、出力 B: 画像生成用プロンプト (Image Generation Prompt)が返ってきました。

漫画の構成（タイトル、スタイル、各コマの詳細）が記述されたYAMLデータのキャプチャ画像

画像生成AIに入力するための、4コマ漫画作成用の詳細な英文プロンプトのキャプチャ画像

このように難しいプロンプトがブワーと出てきたのですが、問題なし。
ちゃんと合っています。

しかも今出したプロンプトで漫画生成する？って聞いてくれました。
もはやコピペの必要もない、素晴らしい気遣い。

画像を生成してくださいとAiに送信してポチッ。

待つこと数十秒・・・できました！

吹き出しが空の状態の、ボクセルキャラがパソコンを操作する4コマ漫画のAI生成画像

うわ～　本当にできてるじゃないか！

ただ実際に画像を生成してみると、「やってしまった！」という反省点や盲点が次々と浮かび上がりました。

「1枚で4枚出力」の限界
今回は手間を省くため、1枚の画像に4コマ全てを描き出す手法をとりました。
しかし、これが仇となります。
1コマ目にはあったカーテンが2コマ目で消えたり、椅子の形状がいつの間にか変わっていたりと、「背景の連続性」を保つのが極めて困難に見えます。
　

AIの皮肉なミス
GoogleのGeminiを使って生成したにもかかわらず、ノートパソコンに描かれたロゴが「某ライバル社」のものに似てしまうという珍事件も発生。
AIの気遣いは細やかですが、こうしたディテールにはまだ甘さがあります。
　

AIで編集を重ねると時間がかかる
最初はこれらを全てAIへの指示だけで直そうとしましたが、かなり難しい作業というのがわかりました。
『2コマ目と3コマ目の左側にカーテンを追加』など1つ1つを直そうとしても思い通りのカーテンにならなかったり、余計にバランスが崩れる始末。
別の方法を考えたほうがよさそうです。
　

AIでの編集は諦める。
ではどうすればいいのか。AIに聞いてみるとCanvaという編集サイトを紹介されました。

最後は「Canva」でゴリ押し

今回必要としたことは、
　・パソコンのロゴを消す
　・背景の矛盾を隠す
　・セリフを入れる

これらは全てCanvaの無料枠でできるとのこと。
早速ブラウザからアクセスして作業を開始、最初は操作性に戸惑ったものの慣れてくれば簡単でした。

結局最後は人力でカバーですね。

画像を被せたり、ロゴ消してセリフを入れた完成形がこちらです。

画像が荒いのは、サイト用にかなり圧縮しているためです。（本当はちゃんと高画質です）

「AIに丸投げ」ではなく、「AIのミスを人間がフォローする」。
この割り切りが、3時間という短時間で完成させるための鍵でした。

まとめ

【制作時間はわずか3時間。AIと人間の「分業」が漫画制作のハードルを壊す】

トータル3時間の制作。
その多くは「仕組み作り」と「企画会議」に費やされました。

一度テンプレートができてしまえば、次からはさらに短時間で作れるでしょう。

「漫画なんて自分には無理だ」と思っていましたが、「AIに描かせて、人間が仕上げる」という分業スタイルなら、初心者の私でも形にすることができました。

AIは何でも出せる打ち出の小槌ではありませんが、あなたの想像力を形にする最高のパートナーになります。

あなたも自分だけの4コマ漫画、描き始めてみませんか？
　

AIには無限の可能性がある。私がゲーム『マインクラフトTRPG』をAIと企画を練って遊んだお話はこちら。

カテゴリー: AIで作ろう

タグ: Gemini Nano Banana Pro 画像生成

初心者が「4コマ漫画」を自作してみた！制作時間3時間の全工程を公開

「AIを使える」から「AIで作れる」へ。文系初心者が挑むクリエイティブの壁

著作権の壁を越え、ボクセルアートで「自分だけ」のキャラクターを召喚する

脚本を渡すだけで「呪文」が躍り出る！YAML形式が生んだ驚きの生成体験

魔法のフォーマット「YAML」とは？

プロンプト作成用プロンプト

AIの限界を「人力」でねじ伏せる。完璧を求めすぎて見えた「1枚出し」の落とし穴

まとめ

建築をAIが採点？ツンデレ姫が指令を出す「マイクラTRPG」で孤独な冒険が神ゲー化

Geminiの混雑時間って世界的に考えて何時なのだろう？

AIに丸投げは卒業。元営業が教える「逆算分析」でプロ級の回答を引き出す