AI歴1ヶ月半、次なる挑戦へ
AIを本格的に使い始めて、早1ヶ月半。
これまでにGemini、Google AI Studio、Colabなど、文系なりに色々なツールを触ってきました。
「もっと新しいことを始めたい!」 そんな思いから、今回挑戦するのは……
『AIで4コマ漫画を作る』です。
絵心がなくても、AI初心者でも、漫画は作れるのか?
試行錯誤のプロセスと完成品をぜひご覧ください。
1. 漫画の命「キャラクター」を用意する
まずは配役(キャラクター)決めです。
ここがいきなり最難関。
AIでキャラを作る時に絶対気をつけなければいけないのが「著作権」です。
- 既存のキャラや作家名を入れたプロンプトはNG
- 完成したキャラが「誰かに似すぎていないか」画像検索でチェック
このハードルを越えるため、私は「自分の写真を参考画像にして、そこからプロンプトを抽出する」という荒業に出ました。
さらに、既存のキャラと被らないようGeminiと壁打ち相談。
「かわいい系がいい」「でもオリジナリティが欲しい」と相談した結果……
「ボクセルアート(積み木のような3Dスタイル)」
という結論に達しました。
これなら独自性バツグンです。(ちなみに私のマインクラフト好きがGeminiにバレてAIが提案してきた説があります)
完成品がこちらです。

画像検索をかけ一致した作品がないことを確認。
ここで「三面図」も一緒に生成しておくと後が楽です。
ちなみに最初のプロンプト出力の指示文はこのような感じでした。
4コマ漫画を作るのでキャラクターのプロンプトを考えてください
なお著作権の問題があるので固有名詞は使わないでください
・3頭身のちびキャラ(男)
・黒髪短髪
・目はブラウン
・基本笑顔
・体型はいたって普通
・服装 上:オレンジ色のタートルネックの長袖 下:黒いクロップドパンツ
・靴下は緑
・アニメ塗りのフルカラー
・かっこいいよりもかわいい系に
参考画像(自分の写真)を添付するので、特徴をプロンプトに反映してください。
2. 世界観を決める「背景」を用意する
次は舞台セット(背景)です。
AIは背景を自動で描いてくれますが、コマごとに部屋のレイアウトが変わると読者が混乱します。
なので、あらかじめ「固定の背景画像」を作っておくことにしました。
今回は「アニメ調の自分の部屋」をイメージして作成。
実は最初、実写っぽくなりすぎたので「アニメ調にして」と修正依頼を出したり、ChatGPTの無料枠を併用したりと、ツールの「いいとこ取り」をしています。
ちなみに指示文はこのような感じでした。
一般的な部屋の画像のプロンプトをください
絶対欲しいもの
・ベッド
・机、いす
・机の上のノートパソコン
あとはアドリブでOK
これで役者と舞台が整いました。
3. 【ここが重要】「プロンプトを作るためのプロンプト」を作る
さて、ここからが今回のハイライトです。
毎回「1コマ目は右上にAさんがいて…」と手打ちするのは面倒だし、指示漏れも起きやすい。
そこで、「AIに漫画の脚本を渡したら、自動で画像生成用のプロンプトに変換してくれるシステム」を先に作りました。
一般的にはこれを「プロンプト作成用プロンプト」と呼ぶみたいですね(自分調べ)。
魔法のフォーマット「YAML」とは?
ここでAIへの指示出しに使ったのが「YAML(ヤムル)」という書き方です。
これがめちゃくちゃ便利。
普通、文章で4コマ漫画の指示を書くとこうなります。
「1コマ目は学校で、Aさんが笑っていて、右上に配置して……」
これが4コマ分ずっと続くので、さすがのAIも「文章が長くてどこが大事かわからん!」となってしまいます。
これをYAML形式にするとこうなります。
1コマ目:
場所: 学校
キャラ: Aさん
表情: 笑顔
→ AI「なるほど!【場所=学校】ね。了解!」
このように「情報のセット」として渡すことで、AIの読み間違いが劇的に減ります。
プロンプト作成用プロンプト
早速AIにプロンプト作成用プロンプトを作ってもらいます。
私が最初にGeminiに提案したチャットの内容がこちら。
4コマ漫画を作るのですが、最終的な画像生成をGeminiにお任せするつもりです
準備はこれだけで足りているでしょうか
・キャラクター画像と三方図の画像
・背景の画像
【ネーム】 (※セリフや画面構成などを決めます)
1 コマ目:Aさん(机の前に座りノートパソコンをマウスで操作している。表情は自然な笑顔、セリフは・・・)
2 コマ目:Aさん(実際は細かい指示が入ります)
3 コマ目:Aさん(実際は細かい指示が入ります)
4 コマ目:Aさん(実際は細かい指示が入ります)
【プロンプト出力の際の希望】
キャラクターの外見は設定に忠実に
コマの位置(top-left, top-right, bottom-left, bottom-right)を明記
背景は具体的に指定
セリフは自然な日本語で
4コマの起承転結を意識
【出力形式】 以下の YAML 形式で英語で出力してください:
panels:- number: 1position: “top-left”
background: ” 背景の説明 “
characters:- name: ” キャラクター名 “
appearance: ” 外見の特徴 “
position: ” 画面内での位置 (left/center/right) “
expression: ” 表情 “
pose: ” ポーズ・動作 “
dialogue: ” セリフ “
以上
これでGeminiにお願いするつもりです
なんで初心者の私がここまでスラスラできているのかと言うと、他サイトを見て勉強したからです。
赤枠内をコピペしてそのままGeminiに送信すればOK。
以下の内容を毎回自分で決められるようにしています。
この時のAIの回答は
- 画風(アートスタイル)の具体的な指定
- セリフ(吹き出し)の処理方法
- 画像生成の単位(1枚絵 vs 4枚生成)
- 中間出力フォーマット(YAML)の最適化
について決めましょうというものでした。
私の返答は、
- このあとにキャラクターを作成
- 空の吹き出しだけつけて文字は自分で挿入する方法にしました。Geminiといえど日本語の文字入れは難ありなのです。
- 4コマ一気に1枚で出力するか、1コマずつ出してあとで合成するか。
精度はもちろん1コマずつ出す方が上がりますし、それこそ日本語の文字もAIで入れられるかも。
しかし面倒くさいので今回は1枚で4コマを生成する方法でお願いしました。
- AIからの提案でYAMLの他に「画像生成AIに入力するための最適化された英語プロンプト(Image Prompts)」も同時に出力したい。
AIがしたいと言うなら、まぁOKしましょう。
この内容で送信すると、なんともうプロンプト作成用プロンプトを作ってくれます。
それがこちら。
この指示書をコピーして、Gemini(私)に貼り付けるだけで、「脚本を渡すと、画像生成用の呪文(プロンプト)が返ってくる」という状態になります。
以下がその「特製指示プロンプト」です。
【コピー用】4コマ漫画プロンプト生成指示書
以下のテキストボックス内の内容をすべてコピーし、新しいチャット(またはこの続き)に貼り付けてください。
その後に「脚本」を入力すると、画像生成用のプロンプトが出力されます。
あなたはプロの「AI画像生成プロンプター」兼「4コマ漫画構成作家」です。
以下の【制約条件】と【キャラクター設定】に基づき、ユーザーが入力する脚本から、画像生成AI(Gemini/Imagen 3)に入力するための「英語プロンプト」と「構成YAML」を作成してください。
# 1. 画像生成のスタイル設定 (Style Guidelines)
* **画風:** Voxel Art, 3D Pixel Art style (Minecraft-like aesthetics but high quality). Cute, vibrant, rendered lighting.
* **形式:** A vertical 4-panel comic strip (one single image containing 4 panels arranged vertically).
* **吹き出し:** Include empty white speech bubbles in each panel for dialogue placement.
* **背景:** Pixel art style anime bedroom or specified location.
# 2. キャラクター設定 (Character Reference)
* **名前:** Aさん(主人公)
* **外見:** A cute voxel-style young man.
* **髪:** Black short hair, blocky texture.
* **服:** Orange long-sleeved shirt (plain), Black shorts.
* **足元:** Green socks visible, Brown shoes.
* **体型:** Chibi style, 2-head tall (SD character).
# 3. 出力プロセス
ユーザーから脚本(ネーム)が提供されたら、以下の2つを出力してください。
## 出力 A: 構成確認用 YAML
(ユーザー指定の形式: panels, number, position, background, characters, appearance, expression, pose, dialogue)
## 出力 B: 画像生成用プロンプト (Image Generation Prompt)
画像生成AIにそのまま貼り付けて「1枚の4コマ漫画」を生成するための英語プロンプトです。以下の構成で書いてください。
* **Subject:** A 4-panel comic strip featuring a voxel art character. Vertical layout.
* **Global Style:** Voxel art, 3D render, cute, 8-bit aesthetic, soft lighting, detailed pixel background.
* **Panel Description:**
* **Panel 1 (Top):** [Description of action, expression, background] with an empty speech bubble.
* **Panel 2:** [Description] with an empty speech bubble.
* **Panel 3:** [Description] with an empty speech bubble.
* **Panel 4 (Bottom):** [Description] with an empty speech bubble.
* **Negative Prompt推奨:** blurry, low quality, text inside bubble, messy text, extra fingers, distorted, realistic human, 2D anime (keep it voxel/3D pixel).
---
どうぞ、脚本(ネーム)を入力してください。
すごい。
数回のやり取りだけでここまでしれくれるとは・・・
あとは脚本を書いてGeminiに渡すだけになりました。
4. いざ生成!そして起きる「AIあるある」
早速プロンプト生成指示書をチャットにコピペし脚本を書いて、参考画像のキャラクターと背景を添付。

送信ボタンを押すと、
出力 A: 構成確認用 YAMLと、出力 B: 画像生成用プロンプト (Image Generation Prompt)が返ってきました。
難しいプロンプトがブワーと出てきたのですが、

今出したプロンプトで漫画生成する?って聞いてくれました。
もはやコピペの必要もない、素晴らしい気遣い。
『生成してください、ポチッ』
待つこと数十秒・・・
チーン
できました!
5. 最後の仕上げは「人力」で

うわ~ 本当にできてるじゃないか!
見た感じ色々修正が必要だが、初回にしては上出来じゃないでしょうか。
少なくとも思い描いていたものにだいぶ近かったです。
それにしてもノートパソコンのロゴよ・・・
GoogleのGeminiがよりにもよってそれを出すのか。
その他にもよく見るとカーテンが2コマ目からなくなってたり、イスの形状が最後変わっていたりと細かい部分が気になる。
これが画像1枚で4コマ出力する弊害でしょうね。
でも今回は力技で乗り切る!

画像を被せました。
これでカーテンもイスも気にならない。
ちなみに吹き出しの文字入れや画像挿入、ロゴ消しは全てデザインツールの『Canva(無料枠)』で行いました。
※画像が荒いのは、サイト用にかなり圧縮しているためです。
綺麗な画像はXに上げてますので完成品を見たい方はXをご覧ください。
まとめ:初心者でも3時間で漫画家になれた
今回かかった時間は、トータル約3時間。
- 事前の勉強とGeminiとの企画会議(壁打ち)
- キャラ・背景の素材作成
- プロンプトの仕組み作り(YAMLなど)
- 生成&Canvaで編集
次回からは「3. 仕組み作り」が不要になるので、もっと短時間で作れるはずです。
「AIで漫画なんて難しそう」
そう思っていた私も、「AIに掻かせて、人間が仕上げる」という分業スタイルで形にすることができました。
みなさんも、自分だけの4コマ漫画、作ってみませんか?


