初心者が「4コマ漫画」を自作してみた!制作時間3時間の全工程を公開

AI歴1ヶ月半、次なる挑戦へ

AIを本格的に使い始めて、早1ヶ月半。
これまでにGemini、Google AI Studio、Colabなど、文系なりに色々なツールを触ってきました。

「もっと新しいことを始めたい!」 そんな思いから、今回挑戦するのは……
『AIで4コマ漫画を作る』です。

絵心がなくても、AI初心者でも、漫画は作れるのか?
試行錯誤のプロセスと完成品をぜひご覧ください。

1. 漫画の命「キャラクター」を用意する

まずは配役(キャラクター)決めです。
ここがいきなり最難関。
AIでキャラを作る時に絶対気をつけなければいけないのが「著作権」です。

  • 既存のキャラや作家名を入れたプロンプトはNG
  • 完成したキャラが「誰かに似すぎていないか」画像検索でチェック

このハードルを越えるため、私は「自分の写真を参考画像にして、そこからプロンプトを抽出する」という荒業に出ました。

さらに、既存のキャラと被らないようGeminiと壁打ち相談。
「かわいい系がいい」「でもオリジナリティが欲しい」と相談した結果……

「ボクセルアート(積み木のような3Dスタイル)」

という結論に達しました。

これなら独自性バツグンです。(ちなみに私のマインクラフト好きがGeminiにバレてAIが提案してきた説があります)

完成品がこちらです。



画像検索をかけ一致した作品がないことを確認。
ここで「三面図」も一緒に生成しておくと後が楽です。

ちなみに最初のプロンプト出力の指示文はこのような感じでした。

最初の依頼内容

4コマ漫画を作るのでキャラクターのプロンプトを考えてください
なお著作権の問題があるので固有名詞は使わないでください

・3頭身のちびキャラ(男)
・黒髪短髪
・目はブラウン
・基本笑顔
・体型はいたって普通
・服装 上:オレンジ色のタートルネックの長袖 下:黒いクロップドパンツ
・靴下は緑
・アニメ塗りのフルカラー
・かっこいいよりもかわいい系に

参考画像(自分の写真)を添付するので、特徴をプロンプトに反映してください。

2. 世界観を決める「背景」を用意する

次は舞台セット(背景)です。
AIは背景を自動で描いてくれますが、コマごとに部屋のレイアウトが変わると読者が混乱します。

なので、あらかじめ「固定の背景画像」を作っておくことにしました。

今回は「アニメ調の自分の部屋」をイメージして作成。

実は最初、実写っぽくなりすぎたので「アニメ調にして」と修正依頼を出したり、ChatGPTの無料枠を併用したりと、ツールの「いいとこ取り」をしています。

ちなみに指示文はこのような感じでした。

最初の依頼内容

一般的な部屋の画像のプロンプトをください
絶対欲しいもの
・ベッド
・机、いす
・机の上のノートパソコン

あとはアドリブでOK

これで役者と舞台が整いました。

3. 【ここが重要】「プロンプトを作るためのプロンプト」を作る

さて、ここからが今回のハイライトです。

毎回「1コマ目は右上にAさんがいて…」と手打ちするのは面倒だし、指示漏れも起きやすい。

そこで、「AIに漫画の脚本を渡したら、自動で画像生成用のプロンプトに変換してくれるシステム」を先に作りました。

一般的にはこれを「プロンプト作成用プロンプト」と呼ぶみたいですね(自分調べ)。

魔法のフォーマット「YAML」とは?

ここでAIへの指示出しに使ったのが「YAML(ヤムル)」という書き方です。
これがめちゃくちゃ便利。

普通、文章で4コマ漫画の指示を書くとこうなります。

「1コマ目は学校で、Aさんが笑っていて、右上に配置して……」

これが4コマ分ずっと続くので、さすがのAIも「文章が長くてどこが大事かわからん!」となってしまいます。

これをYAML形式にするとこうなります。

1コマ目:
  場所: 学校
  キャラ: Aさん
  表情: 笑顔

→ AI「なるほど!【場所=学校】ね。了解!」

このように「情報のセット」として渡すことで、AIの読み間違いが劇的に減ります

プロンプト作成用プロンプト

早速AIにプロンプト作成用プロンプトを作ってもらいます。
私が最初にGeminiに提案したチャットの内容がこちら。

4コマ漫画を作るのですが、最終的な画像生成をGeminiにお任せするつもりです
準備はこれだけで足りているでしょうか

・キャラクター画像と三方図の画像
・背景の画像

【ネーム】 (※セリフや画面構成などを決めます)

1 コマ目:Aさん(机の前に座りノートパソコンをマウスで操作している。表情は自然な笑顔、セリフは・・・)
2 コマ目:Aさん(実際は細かい指示が入ります)
3 コマ目:Aさん(実際は細かい指示が入ります)
4 コマ目:Aさん(実際は細かい指示が入ります)

【プロンプト出力の際の希望】
キャラクターの外見は設定に忠実に
コマの位置(top-left, top-right, bottom-left, bottom-right)を明記
背景は具体的に指定
セリフは自然な日本語で
4コマの起承転結を意識

【出力形式】 以下の YAML 形式で英語で出力してください:
panels:- number: 1position: “top-left”
background: ” 背景の説明 “
characters:- name: ” キャラクター名 “
appearance: ” 外見の特徴 “
position: ” 画面内での位置 (left/center/right) “
expression: ” 表情 “
pose: ” ポーズ・動作 “
dialogue: ” セリフ “

以上
これでGeminiにお願いするつもりです

なんで初心者の私がここまでスラスラできているのかと言うと、他サイトを見て勉強したからです。

赤枠内をコピペしてそのままGeminiに送信すればOK。
以下の内容を毎回自分で決められるようにしています。

この時のAIの回答は

  • 画風(アートスタイル)の具体的な指定
  • セリフ(吹き出し)の処理方法
  • 画像生成の単位(1枚絵 vs 4枚生成)
  • 中間出力フォーマット(YAML)の最適化

について決めましょうというものでした。
私の返答は、

  • このあとにキャラクターを作成
     
  • 空の吹き出しだけつけて文字は自分で挿入する方法にしました。Geminiといえど日本語の文字入れは難ありなのです。
     
  • 4コマ一気に1枚で出力するか、1コマずつ出してあとで合成するか。
    精度はもちろん1コマずつ出す方が上がりますし、それこそ日本語の文字もAIで入れられるかも。
    しかし面倒くさいので今回は1枚で4コマを生成する方法でお願いしました。
     
  • AIからの提案でYAMLの他に「画像生成AIに入力するための最適化された英語プロンプト(Image Prompts)」も同時に出力したい。

    AIがしたいと言うなら、まぁOKしましょう。

この内容で送信すると、なんともうプロンプト作成用プロンプトを作ってくれます。
それがこちら。

この指示書をコピーして、Gemini(私)に貼り付けるだけで、「脚本を渡すと、画像生成用の呪文(プロンプト)が返ってくる」という状態になります。

以下がその「特製指示プロンプト」です。

【コピー用】4コマ漫画プロンプト生成指示書

以下のテキストボックス内の内容をすべてコピーし、新しいチャット(またはこの続き)に貼り付けてください。
その後に「脚本」を入力すると、画像生成用のプロンプトが出力されます。

あなたはプロの「AI画像生成プロンプター」兼「4コマ漫画構成作家」です。
以下の【制約条件】と【キャラクター設定】に基づき、ユーザーが入力する脚本から、画像生成AI(Gemini/Imagen 3)に入力するための「英語プロンプト」と「構成YAML」を作成してください。

# 1. 画像生成のスタイル設定 (Style Guidelines)
* **画風:** Voxel Art, 3D Pixel Art style (Minecraft-like aesthetics but high quality). Cute, vibrant, rendered lighting.
* **形式:** A vertical 4-panel comic strip (one single image containing 4 panels arranged vertically).
* **吹き出し:** Include empty white speech bubbles in each panel for dialogue placement.
* **背景:** Pixel art style anime bedroom or specified location.

# 2. キャラクター設定 (Character Reference)
* **名前:** Aさん(主人公)
* **外見:** A cute voxel-style young man.
    * **髪:** Black short hair, blocky texture.
    * **服:** Orange long-sleeved shirt (plain), Black shorts.
    * **足元:** Green socks visible, Brown shoes.
    * **体型:** Chibi style, 2-head tall (SD character).

# 3. 出力プロセス
ユーザーから脚本(ネーム)が提供されたら、以下の2つを出力してください。

## 出力 A: 構成確認用 YAML
(ユーザー指定の形式: panels, number, position, background, characters, appearance, expression, pose, dialogue)

## 出力 B: 画像生成用プロンプト (Image Generation Prompt)
画像生成AIにそのまま貼り付けて「1枚の4コマ漫画」を生成するための英語プロンプトです。以下の構成で書いてください。
* **Subject:** A 4-panel comic strip featuring a voxel art character. Vertical layout.
* **Global Style:** Voxel art, 3D render, cute, 8-bit aesthetic, soft lighting, detailed pixel background.
* **Panel Description:**
    * **Panel 1 (Top):** [Description of action, expression, background] with an empty speech bubble.
    * **Panel 2:** [Description] with an empty speech bubble.
    * **Panel 3:** [Description] with an empty speech bubble.
    * **Panel 4 (Bottom):** [Description] with an empty speech bubble.
* **Negative Prompt推奨:** blurry, low quality, text inside bubble, messy text, extra fingers, distorted, realistic human, 2D anime (keep it voxel/3D pixel).

---
どうぞ、脚本(ネーム)を入力してください。

すごい。
数回のやり取りだけでここまでしれくれるとは・・・

あとは脚本を書いてGeminiに渡すだけになりました。

4. いざ生成!そして起きる「AIあるある」

早速プロンプト生成指示書をチャットにコピペし脚本を書いて、参考画像のキャラクターと背景を添付。

送信ボタンを押すと、

出力 A: 構成確認用 YAMLと、出力 B: 画像生成用プロンプト (Image Generation Prompt)が返ってきました。

難しいプロンプトがブワーと出てきたのですが、

今出したプロンプトで漫画生成する?って聞いてくれました。
もはやコピペの必要もない、素晴らしい気遣い。

『生成してください、ポチッ』

待つこと数十秒・・・

チーン

できました!

5. 最後の仕上げは「人力」で

うわ~ 本当にできてるじゃないか!
見た感じ色々修正が必要だが、初回にしては上出来じゃないでしょうか。

少なくとも思い描いていたものにだいぶ近かったです。

それにしてもノートパソコンのロゴよ・・・
GoogleのGeminiがよりにもよってそれを出すのか。

その他にもよく見るとカーテンが2コマ目からなくなってたり、イスの形状が最後変わっていたりと細かい部分が気になる。

これが画像1枚で4コマ出力する弊害でしょうね。

でも今回は力技で乗り切る!

画像を被せました。
これでカーテンもイスも気にならない。

ちなみに吹き出しの文字入れや画像挿入、ロゴ消しは全てデザインツールの『Canva(無料枠)』で行いました。

※画像が荒いのは、サイト用にかなり圧縮しているためです。
 綺麗な画像はXに上げてますので完成品を見たい方はXをご覧ください。

まとめ:初心者でも3時間で漫画家になれた

今回かかった時間は、トータル約3時間

  1. 事前の勉強とGeminiとの企画会議(壁打ち)
  2. キャラ・背景の素材作成
  3. プロンプトの仕組み作り(YAMLなど)
  4. 生成&Canvaで編集

次回からは「3. 仕組み作り」が不要になるので、もっと短時間で作れるはずです。

「AIで漫画なんて難しそう」
そう思っていた私も、「AIに掻かせて、人間が仕上げる」という分業スタイルで形にすることができました。

みなさんも、自分だけの4コマ漫画、作ってみませんか?