I

elevenlabs-music

作成者 inferen-sh

inference.sh CLI と ElevenLabs を使って、テキストプロンプトからオリジナルの AI 音楽を生成します。ターミナルから直接、長さ・スタイル・雰囲気をコントロールしながら、商用利用可能なロイヤリティフリーの BGM、サウンドトラック、ジングル、ポッドキャスト用ベッド、ゲーム用オーディオを作成できます。

スター0
お気に入り0
コメント0
追加日2026年3月27日
カテゴリーAudio Editing
インストールコマンド
npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-music
概要

概要

elevenlabs-music とは?

elevenlabs-music は、コマンドライン中心で使える AI 音楽生成スキルです。inference.shinfsh)CLI を通じて、あなたのエージェントやターミナルワークフローを ElevenLabs の音楽モデルに接続します。

短いテキストプロンプトを入力するだけで、プロジェクトに合わせたオリジナルのロイヤリティフリー音楽を生成できます。このスキルは inference.sh 上の elevenlabs/music アプリをラップしており、次のようなことが可能です。

  • テキストの説明から音楽を生成する(text-to-music)
  • トラックの長さを 5 秒〜10 分の範囲で指定
  • プロンプトでジャンル・ムード・楽器構成を細かく指定
  • 動画・ポッドキャスト・ゲームなどで使える商用利用向けオーディオを生成

このスキルは誰向け?

elevenlabs-music は次のようなユーザー向けに設計されています。

  • クリエイターや編集者:YouTube、TikTok、ライブ配信、ポッドキャスト、トレーラー用に、素早くカスタム BGM が欲しい人
  • ゲーム・アプリ開発者:ステージやメニュー、アプリ内体験に合わせて、オンデマンドで音楽ベッドを生成したい人
  • マーケターやブランドチーム:毎回コンポーザーを起用せずに、ジングルや短いキュー、広告向けの音楽を量産したい人
  • 開発者やエージェント構築者:スクリプトや自動化、AI エージェントから音楽を生成できる、予測可能な CLI / API 風インターフェースが欲しい人

すでに inference.sh を利用している、または CLI ツールを中心にワークフローを組んでいる場合、elevenlabs-music は自然にスタックへ組み込めます。

elevenlabs-music はどんな課題を解決する?

次のようなシーンで役に立ちます。

  • ストック音源サイトを漁ることなく、素早くロイヤリティフリー音楽を用意したい
  • シリーズ企画のために、統一感のあるスタイルの曲を必要な分だけ作りたい
  • エージェントやスクリプトがユーザー入力やコンテンツのメタデータに応じて音楽を生成する、自動化しやすいオーディオ制作を行いたい

infsh app run elevenlabs/music で動作するため、シェルスクリプトや CI パイプライン、チャットベースのエージェントに組み込んでも、独自の API レイヤーを構築する必要がありません。

elevenlabs-music が向いているケース / 向いていないケース

以下のような場合に特に向いています。

  • 基本的な CLI コマンド操作、または CLI を呼び出すエージェントツールの利用に慣れている
  • フル構成のボーカル曲というより、BGM・環境音・シンプルなキューを生成したい
  • 素早く試行錯誤したい:複数のプロンプトや長さを変えながら最適なトラックを探したい

一方、次のような用途にはあまり向きません。

  • 小節・テンポマップ・コード進行などをプログラム的に制御する、細かなアレンジ操作が必須な場合
  • **ボーカルパフォーマンスや歌詞同期、マルチトラックステム(ドラム・ベース・ボーカルの分離など)**が必要な場合
  • inference.sh CLI を一切使いたくない場合(このスキルは infsh に依存しています)

使い方

1. 前提条件とインストール

環境の確認

elevenlabs-music を使用する前に、次の環境が整っていることを確認してください。

  • inference.sh CLIinfsh)をインストールして実行できるシステム
  • infsh から ElevenLabs ベースの elevenlabs/music アプリへアクセスできるネットワーク環境

エージェント環境へのスキル追加

inferen-sh/skills リポジトリで説明されている skills loader を利用している場合、次のコマンドで elevenlabs-music を追加できます。

npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-music

このコマンドで、リポジトリからスキル定義が取得され、エージェントツールから利用できるようになります。

inference.sh CLI のインストール

elevenlabs-music は infsh CLI に依存しています。リポジトリにある公式手順に従ってインストールしてください。

  • CLI インストールガイド: https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md

インストール後、次のコマンドで動作確認を行います。

infsh --help

ヘルプテキストが表示されれば、CLI の準備は完了です。

2. inference.sh にログイン

音楽を生成する前に、CLI セッションを認証します。

infsh login

対話的なプロンプトに従ってログインを完了してください。これにより infsh とあなたの inference.sh アカウントが紐付き、elevenlabs/music アプリへのアクセスが有効になります。

3. 最初の AI 音楽トラックを生成

基本的な text-to-music コマンド

ログインできたら、シンプルなプロンプトですぐに音楽を生成できます。

infsh app run elevenlabs/music --input '{"prompt": "Upbeat electronic dance track with driving synths"}'

このコマンドは、あなたの説明文を inference.sh 経由で ElevenLabs の音楽モデルに送信します。出力は、生成されたオーディオへの参照(URL やファイルメタデータなど、CLI の設定によって異なります)を含む JSON になります。

4. 長さとスタイルの調整

elevenlabs-music スキルでは、基盤となるアプリのパラメータを公開しているため、生成結果を細かくチューニングできます。

利用できるパラメータ

  • prompt(string, 必須)
    • 生成したい音楽の自然文による説明(最大 2000 文字)。
    • 可能な限り、ジャンル・ムード・テンポ・使用したい楽器などを含めてください。
  • duration_seconds(number, 任意)
    • デフォルト: 30
    • 最小: 5, 最大: 600(最大 10 分)

使用例

例:10 秒のショート BGM(ロゴ用スティング)

infsh app run elevenlabs/music --input '{
  "prompt": "Short cinematic logo sting with orchestral hit and subtle whoosh",
  "duration_seconds": 10
}'

例:2 分の lo-fi 勉強用ビート

infsh app run elevenlabs/music --input '{
  "prompt": "Lo-fi hip hop beat, chill study music, vinyl crackle, mellow piano",
  "duration_seconds": 120
}'

このように、イントロやジングル用の短いトラックから、長めの BGM まで、用途に応じて長さを柔軟に変えられます。

5. 出力の読み取り方

ElevenLabs の音楽生成は inference.sh のアプリ環境内で実行され、JSON 形式の出力として返ってきます。具体的な構造は将来的に変わる可能性がありますが、一般的には生成されたオーディオを指し示すキー(レンダリングされたファイルの URL や inference.sh 内の ID など)が含まれます。

一般的な次のステップとしては:

  • スクリプトやエージェント側で JSON をパースする
  • DAW・動画編集ソフト・ポッドキャスト編集ツールなどで使うために、オーディオファイルをダウンロードする
  • メディアアセットと一緒に、プロンプト・長さ・タイムスタンプなどのメタデータを保存し、後からの再生成やドキュメント用途に備える

6. エージェントやワークフロー内での elevenlabs-music の利用

このスキルは inferen-sh/skills リポジトリ内で定義され、Bash 経由で infsh を使うように指定されているため、エージェントは次のような動作が可能です。

  • 「動画のイントロ用に BGM を作って」などのユーザー意図を検出したときに、infsh app run elevenlabs/music を呼び出す
  • ユーザーからの指示内容に応じて、promptduration_seconds を動的に構築する
  • 生成された音楽のリンクやファイル参照をユーザーや後続ツールに返す

これにより elevenlabs-music は次のようなシナリオで有用です。

  • マルチステップのコンテンツ制作パイプライン(例:スクリプト生成 → 画像生成 → 音楽生成)
  • リクエストに応じてカスタムサウンドトラックを提供できる、チャットベースのクリエイティブアシスタント

7. 確認しておきたいファイルと設定

スキルをインストールしたら、挙動を理解したりカスタマイズしたりするために、inferen-sh/skills リポジトリ内の次のファイルを確認してみてください。

  • SKILL.md(このスキルのルートレベル): スキルの概要とクイックスタート用コマンド
  • tools/audio/elevenlabs-music/(手元のクローンに存在する場合): 実装の詳細や補助スクリプト

これらのファイルには、スキルが CLI とどのように連携しているかや、変更点・アップデートの情報が記載されています。

FAQ

elevenlabs-music は無料で使えますか?

elevenlabs-music 自体は、inference.sh 経由で elevenlabs/music アプリに接続するためのスキル定義です。利用料金や制限は、このスキルではなく、あなたの inference.sh アカウントおよび ElevenLabs の設定・契約内容に依存します。

大規模に利用する前に、inference.sh アカウントと ElevenLabs のプランで、料金・クオータ・レート制限を確認してください。

elevenlabs-music はどんな種類の音楽を生成できますか?

基盤となる ElevenLabs モデルは、自然文プロンプトに基づいたインストゥルメンタル中心の BGM タイプのトラックに最適化されています。例えば次のような指定が可能です。

  • ジャンル:lo-fi, EDM, cinematic, ambient, rock, orchestral など
  • ムード:upbeat, dark, suspenseful, relaxing, uplifting など
  • 文脈:study music, trailer score, game level theme, podcast intro, advertisement bed など

ムード + ジャンル + 楽器 + 用途コンテキストを組み合わせた、具体的なプロンプトを書くと結果が安定しやすくなります。

生成できるトラックの長さはどれくらいですか?

duration_seconds5 秒〜600 秒の範囲で設定できます。

  • 最小: 5
  • 最大: 600(10 分)

このパラメータを省略した場合、デフォルトは 30 秒です。

音楽の長さを変更するにはどうすればいいですか?

--input に渡す JSON 内で duration_seconds を指定します。

infsh app run elevenlabs/music --input '{
  "prompt": "Epic orchestral battle music",
  "duration_seconds": 300
}'

5〜600 秒の範囲内で、必要な長さに数値を調整してください。

elevenlabs-music で作った曲は商用利用できますか?

SKILL の説明では、inference.sh 経由の ElevenLabs AI 音楽生成の機能として、ロイヤリティフリーでの商用利用が可能であるとされています。ただし、ElevenLabs および inference.sh の利用規約やライセンス条件は変更される可能性があるため、必ず最新の公式情報を確認してください。

elevenlabs-music を使うのにコードを書く必要はありますか?

フルスケールのアプリケーションコードを書く必要はありませんが、次のような操作に慣れているとスムーズです。

  • ターミナルでコマンドを実行する
  • --input フラグで JSON を渡す

より高度な統合(Web アプリやエージェントプラットフォーム内からの利用など)の場合、通常はコードから infsh を呼び出すか、利用中のエージェントフレームワークが提供する CLI 呼び出し機構を使って連携します。

elevenlabs-music は声や歌詞に対応していますか?

このスキルは、テキストプロンプトからの音楽生成に特化しており、歌詞のタイミング合わせやボーカルパフォーマンスを直接扱うものではありません。プロンプト内で「choir pads」や「vocal chops」のようにボーカル的な質感を指定することはできますが、歌詞とメロディを厳密に同期させたボーカル生成は、このスキルの想定範囲外です。

詳細情報や最新情報はどこで確認できますか?

inferen-sh/skills リポジトリ内の該当スキルを参照してください。

  • Repo: https://github.com/inferen-sh/skills
  • Skill path: tools/audio/elevenlabs-music

最新のサンプル、利用可能なパラメータ、CLI の使用メモなどは SKILL.md および関連ファイルにまとめられています。CLI やアプリ名に変更があった場合も、これらのファイルが優先的に更新される想定です。

評価とレビュー

まだ評価がありません
レビューを投稿
このスキルの評価やコメントを投稿するにはサインインしてください。
G
0/10000
新着レビュー
保存中...