elevenlabs-music
作成者 inferen-shinference.sh CLI と ElevenLabs を使って、テキストプロンプトからオリジナルの AI 音楽を生成します。ターミナルから直接、長さ・スタイル・雰囲気をコントロールしながら、商用利用可能なロイヤリティフリーの BGM、サウンドトラック、ジングル、ポッドキャスト用ベッド、ゲーム用オーディオを作成できます。
概要
elevenlabs-music とは?
elevenlabs-music は、コマンドライン中心で使える AI 音楽生成スキルです。inference.sh(infsh)CLI を通じて、あなたのエージェントやターミナルワークフローを ElevenLabs の音楽モデルに接続します。
短いテキストプロンプトを入力するだけで、プロジェクトに合わせたオリジナルのロイヤリティフリー音楽を生成できます。このスキルは inference.sh 上の elevenlabs/music アプリをラップしており、次のようなことが可能です。
- テキストの説明から音楽を生成する(text-to-music)
- トラックの長さを 5 秒〜10 分の範囲で指定
- プロンプトでジャンル・ムード・楽器構成を細かく指定
- 動画・ポッドキャスト・ゲームなどで使える商用利用向けオーディオを生成
このスキルは誰向け?
elevenlabs-music は次のようなユーザー向けに設計されています。
- クリエイターや編集者:YouTube、TikTok、ライブ配信、ポッドキャスト、トレーラー用に、素早くカスタム BGM が欲しい人
- ゲーム・アプリ開発者:ステージやメニュー、アプリ内体験に合わせて、オンデマンドで音楽ベッドを生成したい人
- マーケターやブランドチーム:毎回コンポーザーを起用せずに、ジングルや短いキュー、広告向けの音楽を量産したい人
- 開発者やエージェント構築者:スクリプトや自動化、AI エージェントから音楽を生成できる、予測可能な CLI / API 風インターフェースが欲しい人
すでに inference.sh を利用している、または CLI ツールを中心にワークフローを組んでいる場合、elevenlabs-music は自然にスタックへ組み込めます。
elevenlabs-music はどんな課題を解決する?
次のようなシーンで役に立ちます。
- ストック音源サイトを漁ることなく、素早くロイヤリティフリー音楽を用意したい
- シリーズ企画のために、統一感のあるスタイルの曲を必要な分だけ作りたい
- エージェントやスクリプトがユーザー入力やコンテンツのメタデータに応じて音楽を生成する、自動化しやすいオーディオ制作を行いたい
infsh app run elevenlabs/music で動作するため、シェルスクリプトや CI パイプライン、チャットベースのエージェントに組み込んでも、独自の API レイヤーを構築する必要がありません。
elevenlabs-music が向いているケース / 向いていないケース
以下のような場合に特に向いています。
- 基本的な CLI コマンド操作、または CLI を呼び出すエージェントツールの利用に慣れている
- フル構成のボーカル曲というより、BGM・環境音・シンプルなキューを生成したい
- 素早く試行錯誤したい:複数のプロンプトや長さを変えながら最適なトラックを探したい
一方、次のような用途にはあまり向きません。
- 小節・テンポマップ・コード進行などをプログラム的に制御する、細かなアレンジ操作が必須な場合
- **ボーカルパフォーマンスや歌詞同期、マルチトラックステム(ドラム・ベース・ボーカルの分離など)**が必要な場合
- inference.sh CLI を一切使いたくない場合(このスキルは
infshに依存しています)
使い方
1. 前提条件とインストール
環境の確認
elevenlabs-music を使用する前に、次の環境が整っていることを確認してください。
- inference.sh CLI(
infsh)をインストールして実行できるシステム infshから ElevenLabs ベースのelevenlabs/musicアプリへアクセスできるネットワーク環境
エージェント環境へのスキル追加
inferen-sh/skills リポジトリで説明されている skills loader を利用している場合、次のコマンドで elevenlabs-music を追加できます。
npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-music
このコマンドで、リポジトリからスキル定義が取得され、エージェントツールから利用できるようになります。
inference.sh CLI のインストール
elevenlabs-music は infsh CLI に依存しています。リポジトリにある公式手順に従ってインストールしてください。
- CLI インストールガイド:
https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md
インストール後、次のコマンドで動作確認を行います。
infsh --help
ヘルプテキストが表示されれば、CLI の準備は完了です。
2. inference.sh にログイン
音楽を生成する前に、CLI セッションを認証します。
infsh login
対話的なプロンプトに従ってログインを完了してください。これにより infsh とあなたの inference.sh アカウントが紐付き、elevenlabs/music アプリへのアクセスが有効になります。
3. 最初の AI 音楽トラックを生成
基本的な text-to-music コマンド
ログインできたら、シンプルなプロンプトですぐに音楽を生成できます。
infsh app run elevenlabs/music --input '{"prompt": "Upbeat electronic dance track with driving synths"}'
このコマンドは、あなたの説明文を inference.sh 経由で ElevenLabs の音楽モデルに送信します。出力は、生成されたオーディオへの参照(URL やファイルメタデータなど、CLI の設定によって異なります)を含む JSON になります。
4. 長さとスタイルの調整
elevenlabs-music スキルでは、基盤となるアプリのパラメータを公開しているため、生成結果を細かくチューニングできます。
利用できるパラメータ
prompt(string, 必須)- 生成したい音楽の自然文による説明(最大 2000 文字)。
- 可能な限り、ジャンル・ムード・テンポ・使用したい楽器などを含めてください。
duration_seconds(number, 任意)- デフォルト:
30 - 最小:
5, 最大:600(最大 10 分)
- デフォルト:
使用例
例:10 秒のショート BGM(ロゴ用スティング)
infsh app run elevenlabs/music --input '{
"prompt": "Short cinematic logo sting with orchestral hit and subtle whoosh",
"duration_seconds": 10
}'
例:2 分の lo-fi 勉強用ビート
infsh app run elevenlabs/music --input '{
"prompt": "Lo-fi hip hop beat, chill study music, vinyl crackle, mellow piano",
"duration_seconds": 120
}'
このように、イントロやジングル用の短いトラックから、長めの BGM まで、用途に応じて長さを柔軟に変えられます。
5. 出力の読み取り方
ElevenLabs の音楽生成は inference.sh のアプリ環境内で実行され、JSON 形式の出力として返ってきます。具体的な構造は将来的に変わる可能性がありますが、一般的には生成されたオーディオを指し示すキー(レンダリングされたファイルの URL や inference.sh 内の ID など)が含まれます。
一般的な次のステップとしては:
- スクリプトやエージェント側で JSON をパースする
- DAW・動画編集ソフト・ポッドキャスト編集ツールなどで使うために、オーディオファイルをダウンロードする
- メディアアセットと一緒に、プロンプト・長さ・タイムスタンプなどのメタデータを保存し、後からの再生成やドキュメント用途に備える
6. エージェントやワークフロー内での elevenlabs-music の利用
このスキルは inferen-sh/skills リポジトリ内で定義され、Bash 経由で infsh を使うように指定されているため、エージェントは次のような動作が可能です。
- 「動画のイントロ用に BGM を作って」などのユーザー意図を検出したときに、
infsh app run elevenlabs/musicを呼び出す - ユーザーからの指示内容に応じて、
promptとduration_secondsを動的に構築する - 生成された音楽のリンクやファイル参照をユーザーや後続ツールに返す
これにより elevenlabs-music は次のようなシナリオで有用です。
- マルチステップのコンテンツ制作パイプライン(例:スクリプト生成 → 画像生成 → 音楽生成)
- リクエストに応じてカスタムサウンドトラックを提供できる、チャットベースのクリエイティブアシスタント
7. 確認しておきたいファイルと設定
スキルをインストールしたら、挙動を理解したりカスタマイズしたりするために、inferen-sh/skills リポジトリ内の次のファイルを確認してみてください。
SKILL.md(このスキルのルートレベル): スキルの概要とクイックスタート用コマンドtools/audio/elevenlabs-music/(手元のクローンに存在する場合): 実装の詳細や補助スクリプト
これらのファイルには、スキルが CLI とどのように連携しているかや、変更点・アップデートの情報が記載されています。
FAQ
elevenlabs-music は無料で使えますか?
elevenlabs-music 自体は、inference.sh 経由で elevenlabs/music アプリに接続するためのスキル定義です。利用料金や制限は、このスキルではなく、あなたの inference.sh アカウントおよび ElevenLabs の設定・契約内容に依存します。
大規模に利用する前に、inference.sh アカウントと ElevenLabs のプランで、料金・クオータ・レート制限を確認してください。
elevenlabs-music はどんな種類の音楽を生成できますか?
基盤となる ElevenLabs モデルは、自然文プロンプトに基づいたインストゥルメンタル中心の BGM タイプのトラックに最適化されています。例えば次のような指定が可能です。
- ジャンル:lo-fi, EDM, cinematic, ambient, rock, orchestral など
- ムード:upbeat, dark, suspenseful, relaxing, uplifting など
- 文脈:study music, trailer score, game level theme, podcast intro, advertisement bed など
ムード + ジャンル + 楽器 + 用途コンテキストを組み合わせた、具体的なプロンプトを書くと結果が安定しやすくなります。
生成できるトラックの長さはどれくらいですか?
duration_seconds を 5 秒〜600 秒の範囲で設定できます。
- 最小:
5 - 最大:
600(10 分)
このパラメータを省略した場合、デフォルトは 30 秒です。
音楽の長さを変更するにはどうすればいいですか?
--input に渡す JSON 内で duration_seconds を指定します。
infsh app run elevenlabs/music --input '{
"prompt": "Epic orchestral battle music",
"duration_seconds": 300
}'
5〜600 秒の範囲内で、必要な長さに数値を調整してください。
elevenlabs-music で作った曲は商用利用できますか?
SKILL の説明では、inference.sh 経由の ElevenLabs AI 音楽生成の機能として、ロイヤリティフリーでの商用利用が可能であるとされています。ただし、ElevenLabs および inference.sh の利用規約やライセンス条件は変更される可能性があるため、必ず最新の公式情報を確認してください。
elevenlabs-music を使うのにコードを書く必要はありますか?
フルスケールのアプリケーションコードを書く必要はありませんが、次のような操作に慣れているとスムーズです。
- ターミナルでコマンドを実行する
--inputフラグで JSON を渡す
より高度な統合(Web アプリやエージェントプラットフォーム内からの利用など)の場合、通常はコードから infsh を呼び出すか、利用中のエージェントフレームワークが提供する CLI 呼び出し機構を使って連携します。
elevenlabs-music は声や歌詞に対応していますか?
このスキルは、テキストプロンプトからの音楽生成に特化しており、歌詞のタイミング合わせやボーカルパフォーマンスを直接扱うものではありません。プロンプト内で「choir pads」や「vocal chops」のようにボーカル的な質感を指定することはできますが、歌詞とメロディを厳密に同期させたボーカル生成は、このスキルの想定範囲外です。
詳細情報や最新情報はどこで確認できますか?
inferen-sh/skills リポジトリ内の該当スキルを参照してください。
- Repo:
https://github.com/inferen-sh/skills - Skill path:
tools/audio/elevenlabs-music
最新のサンプル、利用可能なパラメータ、CLI の使用メモなどは SKILL.md および関連ファイルにまとめられています。CLI やアプリ名に変更があった場合も、これらのファイルが優先的に更新される想定です。
