Geminiで作曲!日本語歌詞もプロ級に歌い上げる新機能を徹底検証
ー Information ー
- この記事はこんな人向け: AIを使った創作に興味があるが、音楽の専門知識がなくハードルを感じている方。
- この記事で学べること: Geminiの新機能「音楽生成」の実力と、思い通りの曲を作るための具体的なコツ。
- 目安読了時間: 約4分
Geminiに突然降臨した「作曲機能」はどこまで実用的か?
GoogleのAI、Geminiに音楽生成機能が突如として実装されました。

これまではテキストや画像、動画がメインでしたが、ついに「音」の世界まで網羅し始めたことになります。
「単なる効果音メーカーかな?」と思いきや、実はテーマに沿った本格的な楽曲が作れるとのこと。
音楽理論なんてさっぱり分からない素人でも、AIの力を借りればプロ級の1曲を錬成できるのか。
さっそく、いくつかの「ムチャぶり」を交えてその実力を検証しました。
鼻歌レベルの指示でOK?16のテーマから始めるAI作曲
機能を起動すると、まずはベースとなる16個のテーマが提示されます。

これらを選択するだけでも、特定の雰囲気に沿った楽曲制作がスタートします。
まずは実際にテーマを選んでチャット欄に日本語の歌詞を入れて『歌ってくれ』と依頼してみました。
しかし、初回はあえなく撃沈。
指示が甘かったのか、テーマ選択が影響したのか、日本語の歌詞を渡したはずが、なぜか流暢な英語の歌が返ってくるという結果に。
ここから、Geminiとの試行錯誤が始まりました。
英語指示で化ける!競馬のファンファーレが本物級のクオリティに
次に、テーマを選ばずチャット欄からの直接指示を試しました。
「3秒くらいの競馬場で流れてそうなファンファーレ」と日本語で頼んだところ、完成したのはなぜかノリノリの「謎のラップ」。
リズム感は悪くないのですが、求めていたものとは程遠い仕上がりです。
現時点では日本語のニュアンスを音楽に変換するのは少し苦手な様子。
そこで指示文を英語に翻訳して再トライしました。
『3秒くらいの競馬場で流れてそうなファンファーレを作曲してみて』を英語で依頼します。
【AIへの指示(プロンプト)】
Try composing a 3-second fanfare that sounds like it would be played at a racetrack.
できあがりがこちら
すると結果は一変。
まさに競馬場のゲートが開く直前のような、高揚感あふれるファンファーレが爆誕したのです。
英語で指示を出すことが、現状の「攻略の鍵」と言えそうです。
「3秒指定」も「無音」も効かない?まだまだ発展途上
今回の検証で、いくつか明確な「現時点での限界」も見えてきました。
ここが一番の注意点です。
- 「30秒」という絶対的な壁
現在採用されている「Lyria 3」モデルでは、生成される楽曲の長さが約30秒に固定されています。
「3秒だけ」「15秒ぴったり」といった指定は無視され、すべて30秒のデータとして出力されます。
短い音源が欲しい場合は、後から編集ソフトでカットする手間が必要です。
- 「無音」が作れない
「10秒後に無音(絶対無音)を挟んで、その後に再開」といった指示を10回以上試しましたが、一度も成功しませんでした。
どれだけ強い言葉で強調しても、何かしらの音が鳴り続けてしまいます。
AIにとって「音を作らないこと」は、音を作ること以上に難しいようです。
- 日本語指示の不安定さ
先述の通り、日本語での指示は意図しないジャンル(ラップなど)に化ける確率が高い傾向にあります。
「まずは日本語で試し、ダメなら英語に翻訳」というスタンスが、現状最も効率的でしょう。
一方で、構成の指示には驚くほど忠実です。
実際にやってみたのがこちら。
・競馬場で流れるファンファーレ
・最初はトランペットのみ、おごそかに演奏
・10秒ほど経ちトランペットに小太鼓、トロンボーンなど効果的に挿入し盛り上がっていく
・20秒からは今までの楽器+大盛り上がりになりシンバルも鳴り響く
これを英訳させてそのままチャットにコピペ送信して作成依頼。
【AIへの指示(プロンプト)】
A fanfare played at a racetrack
At first, it's played by trumpet alone.
After about 10 seconds, the trumpet is joined by snare drums, trombones, and other instruments, creating a climax.
At 20 seconds, the previous instruments are added, and the cymbals are added to the mix, creating a dramatic climax.
ちゃんとそれっぽく時間通りに演奏されています。
日本語歌詞もエモーショナルに。想像を超えた「歌唱力」の正体
最後にもう一度、日本語の歌詞に挑戦。
一番最初はテーマを選んで失敗したので、今度はテーマなしでやってみます。
Gemini自身に歌詞を生成させ、「君の窓辺に写るとき、愛がまぶしく見えそうろう」という、少し風変わりなポエムを歌わせてみました。

しんみりとしたバラード調のメロディに乗せて、感情たっぷりに歌い上げるその姿(声)には驚かされました。
特筆すべきは「ブレス(息継ぎ)音」のリアルさです。
ボーカロイドとはまた違う、人間が歌っているかのような生々しさがあり、AIの進化を肌で感じる瞬間でした。
気になる利用制限は?
なお、利用制限などについてGeminiに聞いてみました。
答えは以下の通りです(2026年2月時点)。
作成上限: 現在のところ1日の回数制限(クォータ)はなし。
透かし: 生成された楽曲にはAI製であることを示す「SynthID」が含まれる。
将来性: 現在はベータ版のような位置づけのため、今後制限がかかる可能性あり。
なんと上限ないそうです。
Geminiくんは時々大嘘つくから念のためもう一度絶対なのか聞いてみました。
が、やはり現状無制限(2026年2月19日確認)らしいです。
なおベータ版だから今後上限がついたりする可能性は大いにあります。
また、GoogleのAI画像生成『Nanobanana』と同じく作った楽曲には「SynthID」が入るということです。
「SynthID」についてはこちらをご参照ください。
AIで作ったのに、『自分で作詞作曲しました!』は通じないので要注意です。
まとめ
【遊び心で未来を鳴らす。まずは日本語歌詞で一曲作ってみませんか?】
いきなり実装されたこの機能、触ってみるとそのポテンシャルの高さに時間を忘れて没頭してしまいます。
長さの指定や無音の挿入など、まだ思い通りにいかない部分も多々あります。
しかし、楽器が弾けなくても、楽譜が読めなくても、言葉ひとつでこれだけのクオリティが手に入るのは革命的です。
まずはあなたの好きなフレーズをGeminiに渡して、「歌ってみて」と頼んでみてください。
AIが紡ぎ出す意外なメロディに、きっと驚かされるはずです。
作った音楽を自分で作った音楽プレーヤーで聞いてみましょう。中身(音楽)も外(プレーヤー)も全部AI製です。


