Geminiで作曲!日本語歌詞もプロ級に歌い上げる新機能を徹底検証

  • この記事はこんな人向け: AIを使った創作に興味があるが、音楽の専門知識がなくハードルを感じている方。
  • この記事で学べること: Geminiの新機能「音楽生成」の実力と、思い通りの曲を作るための具体的なコツ。
  • 目安読了時間: 約4分

Geminiに突然降臨した「作曲機能」はどこまで実用的か?

GoogleのAI、Geminiに音楽生成機能が突如として実装されました。

Geminiの「音楽を作成」ボタンと新機能の通知が表示された操作画面

これまではテキストや画像、動画がメインでしたが、ついに「音」の世界まで網羅し始めたことになります。

「単なる効果音メーカーかな?」と思いきや、実はテーマに沿った本格的な楽曲が作れるとのこと。

音楽理論なんてさっぱり分からない素人でも、AIの力を借りればプロ級の1曲を錬成できるのか
さっそく、いくつかの「ムチャぶり」を交えてその実力を検証しました。

鼻歌レベルの指示でOK?16のテーマから始めるAI作曲

機能を起動すると、まずはベースとなる16個のテーマが提示されます。

多様な音楽ジャンルの選択肢が並ぶ「リミックスするトラックを選択」画面

これらを選択するだけでも、特定の雰囲気に沿った楽曲制作がスタートします。

まずは実際にテーマを選んでチャット欄に日本語の歌詞を入れて『歌ってくれ』と依頼してみました。

しかし、初回はあえなく撃沈。
指示が甘かったのか、テーマ選択が影響したのか、日本語の歌詞を渡したはずが、なぜか流暢な英語の歌が返ってくるという結果に。

ここから、Geminiとの試行錯誤が始まりました。

英語指示で化ける!競馬のファンファーレが本物級のクオリティに

次に、テーマを選ばずチャット欄からの直接指示を試しました。

「3秒くらいの競馬場で流れてそうなファンファーレ」と日本語で頼んだところ、完成したのはなぜかノリノリの「謎のラップ」。

リズム感は悪くないのですが、求めていたものとは程遠い仕上がりです。

現時点では日本語のニュアンスを音楽に変換するのは少し苦手な様子。
そこで指示文を英語に翻訳して再トライしました。

『3秒くらいの競馬場で流れてそうなファンファーレを作曲してみて』を英語で依頼します。

【AIへの指示(プロンプト)】

Try composing a 3-second fanfare that sounds like it would be played at a racetrack.

できあがりがこちら

すると結果は一変

まさに競馬場のゲートが開く直前のような、高揚感あふれるファンファーレが爆誕したのです。

英語で指示を出すことが、現状の「攻略の鍵」と言えそうです。

「3秒指定」も「無音」も効かない?まだまだ発展途上

今回の検証で、いくつか明確な「現時点での限界」も見えてきました。
ここが一番の注意点です。

  • 「30秒」という絶対的な壁
     
    現在採用されている「Lyria 3」モデルでは、生成される楽曲の長さが約30秒に固定されています。
    「3秒だけ」「15秒ぴったり」といった指定は無視され、すべて30秒のデータとして出力されます。
    短い音源が欲しい場合は、後から編集ソフトでカットする手間が必要です。
     
  • 「無音」が作れない
     
    「10秒後に無音(絶対無音)を挟んで、その後に再開」といった指示を10回以上試しましたが、一度も成功しませんでした。
    どれだけ強い言葉で強調しても、何かしらの音が鳴り続けてしまいます。
    AIにとって「音を作らないこと」は、音を作ること以上に難しいようです。
      
  • 日本語指示の不安定さ
     
    先述の通り、日本語での指示は意図しないジャンル(ラップなど)に化ける確率が高い傾向にあります。
    「まずは日本語で試し、ダメなら英語に翻訳」というスタンスが、現状最も効率的でしょう。

一方で、構成の指示には驚くほど忠実です。

実際にやってみたのがこちら。

・競馬場で流れるファンファーレ
・最初はトランペットのみ、おごそかに演奏
・10秒ほど経ちトランペットに小太鼓、トロンボーンなど効果的に挿入し盛り上がっていく
・20秒からは今までの楽器+大盛り上がりになりシンバルも鳴り響く

これを英訳させてそのままチャットにコピペ送信して作成依頼。

【AIへの指示(プロンプト)】

A fanfare played at a racetrack

At first, it's played by trumpet alone.
After about 10 seconds, the trumpet is joined by snare drums, trombones, and other instruments, creating a climax.
At 20 seconds, the previous instruments are added, and the cymbals are added to the mix, creating a dramatic climax.

ちゃんとそれっぽく時間通りに演奏されています。

日本語歌詞もエモーショナルに。想像を超えた「歌唱力」の正体

最後にもう一度、日本語の歌詞に挑戦。
一番最初はテーマを選んで失敗したので、今度はテーマなしでやってみます。

Gemini自身に歌詞を生成させ、「君の窓辺に写るとき、愛がまぶしく見えそうろう」という、少し風変わりなポエムを歌わせてみました。

ユーザーが入力した歌詞に対してGeminiが楽曲を生成したチャット画面

 


しんみりとしたバラード調のメロディに乗せて、感情たっぷりに歌い上げるその姿(声)には驚かされました。

特筆すべきは「ブレス(息継ぎ)音」のリアルさです。
ボーカロイドとはまた違う、人間が歌っているかのような生々しさがあり、AIの進化を肌で感じる瞬間でした。

気になる利用制限は?

なお、利用制限などについてGeminiに聞いてみました。
答えは以下の通りです(2026年2月時点)。

作成上限: 現在のところ1日の回数制限(クォータ)はなし。

透かし: 生成された楽曲にはAI製であることを示す「SynthID」が含まれる。

将来性: 現在はベータ版のような位置づけのため、今後制限がかかる可能性あり。


なんと上限ないそうです。

Geminiくんは時々大嘘つくから念のためもう一度絶対なのか聞いてみました。
が、やはり現状無制限(2026年2月19日確認)らしいです。

なおベータ版だから今後上限がついたりする可能性は大いにあります。

また、GoogleのAI画像生成『Nanobanana』と同じく作った楽曲には「SynthID」が入るということです。
「SynthID」についてはこちらをご参照ください。

【検証】無料版Geminiの限界。AI画像を見抜くなら「Pro」一択の理由

AI画像を見抜く力を身につけ、情報の真実を確かめましょう!Gemini高速モードとProの精度の差を徹底検証。肉眼では分からないフェイクも、賢いAIなら細かな矛盾まで見破れ…

AIで作ったのに、『自分で作詞作曲しました!』は通じないので要注意です。

まとめ

【遊び心で未来を鳴らす。まずは日本語歌詞で一曲作ってみませんか?】

いきなり実装されたこの機能、触ってみるとそのポテンシャルの高さに時間を忘れて没頭してしまいます。

長さの指定や無音の挿入など、まだ思い通りにいかない部分も多々あります。
しかし、楽器が弾けなくても、楽譜が読めなくても、言葉ひとつでこれだけのクオリティが手に入るのは革命的です。

まずはあなたの好きなフレーズをGeminiに渡して、「歌ってみて」と頼んでみてください。
AIが紡ぎ出す意外なメロディに、きっと驚かされるはずです。
 

作った音楽を自分で作った音楽プレーヤーで聞いてみましょう。中身(音楽)も外(プレーヤー)も全部AI製です。

AIまかせでアプリ開発?未経験者がPythonで作る音楽プレーヤー

知識ゼロから自分専用のアプリが作れる!プログラミング未経験でもAIを相棒にすれば、音楽プレーヤー制作は驚くほど簡単です。「難しそう」という悩みもAIとの対話でスッ…