elevenlabs-music

von inferen-sh

Erzeuge originale KI-Musik aus Textprompts mit der inference.sh CLI und ElevenLabs. Steuere Länge, Stil und Stimmung, um direkt aus deinem Terminal lizenzfreie Hintergrundmusik, Soundtracks, Jingles, Podcast-Betten und Game-Audio zu erstellen.

Stars0

Favoriten0

Kommentare0

Hinzugefügt27. März 2026

KategorieAudio Editing

Installationsbefehl

npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-music

Audio Cli API Ai Developer Audience

Überblick

Was ist elevenlabs-music?

elevenlabs-music ist ein auf die Kommandozeile fokussiertes KI-Musik-Tool, das deinen Agent- oder Terminal-Workflow über die inference.sh (infsh) CLI mit dem ElevenLabs Music Model verbindet.

Mit einem kurzen Textprompt kannst du originale, lizenzfreie Musik erstellen, die auf dein Projekt zugeschnitten ist. Das Skill kapselt die elevenlabs/music App auf inference.sh, sodass du:

Textbeschreibungen in Musik verwandeln kannst (Text-to-Music)
Die Track-Länge von 5 Sekunden bis zu 10 Minuten steuern kannst
Genre, Stimmung und Instrumentierung im Prompt vorgeben kannst
Audio erzeugen kannst, das sich für den kommerziellen Einsatz eignet – etwa für Videos, Podcasts und Games

Für wen ist dieses Skill gedacht?

elevenlabs-music richtet sich an:

Creator und Cutter, die schnell individuelle Hintergrundtracks für YouTube, TikTok, Livestreams, Podcasts oder Trailer benötigen
Game- und App-Entwickler, die adaptive, On-Demand-Musikbetten für Levels, Menüs oder In-App-Erlebnisse suchen
Marketing- und Brand-Teams, die Jingles, kurze Cues und werbetaugliche Musik erstellen möchten, ohne für jede Variante einen Komponisten zu beauftragen
Entwickler und Agent-Builder, die eine verlässliche CLI-/API-artige Schnittstelle brauchen, um Musik direkt aus Scripts, Automationen oder KI-Agents zu generieren

Wenn du bereits inference.sh nutzt oder Workflows rund um CLI-Tools baust, fügt sich elevenlabs-music nahtlos in deinen Stack ein.

Welche Probleme löst elevenlabs-music?

Dieses Skill hilft dir, wenn du brauchst:

Schnelle, lizenzfreie Musik, ohne dich durch Stock-Libraries wühlen zu müssen
Stilistische Konsistenz on demand (z. B. mehrere Tracks mit ähnlicher Stimmung für eine Serie)
Automationsfreundliche Audio-Erstellung, bei der ein Agent oder Script Musik als Reaktion auf Nutzereingaben oder Content-Metadaten generiert

Da es über infsh app run elevenlabs/music läuft, kannst du es in Shell-Scripts, CI-Pipelines oder chatbasierte Agents integrieren, ohne eine eigene API-Schicht zu bauen.

Wann ist elevenlabs-music eine gute Wahl?

Nutze elevenlabs-music, wenn:

du dich mit grundlegenden CLI-Kommandos oder Agent-Tools, die die CLI aufrufen, wohlfühlst
du eher Hintergrundmusik, Atmosphären oder einfache Cues erzeugen willst als voll durcharrangierte Songs mit Gesang
du schnell iterieren möchtest: mehrere Prompts und Längen ausprobieren, bis der Track passt

Weniger geeignet ist es, wenn:

du fein steuerbare musikalische Arrangements brauchst (Takte, Tempomaps, Akkordfolgen), die programmatisch kontrolliert werden
du Gesang, Lyrik-Synchronisation oder Multi-Stem-Exports brauchst (z. B. getrennte Spuren für Drums, Bass, Vocals)
du die inference.sh CLI überhaupt nicht verwenden möchtest – dieses Skill hängt von infsh ab

Nutzung

1. Voraussetzungen und Installation

Umgebung prüfen

Bevor du elevenlabs-music nutzt, stelle sicher, dass du Folgendes hast:

Ein System, auf dem du die inference.sh CLI (infsh) installieren und ausführen kannst
Netzwerkzugriff, damit infsh die von ElevenLabs betriebene elevenlabs/music App aufrufen kann

Skill in deine Agent-Umgebung installieren

Wenn du den Skill-Loader aus dem inferen-sh/skills-Repo verwendest, installiere elevenlabs-music mit:

npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-music

Damit wird die Skill-Definition aus dem Repository geladen und für deine Agent-Tools verfügbar gemacht.

inference.sh CLI installieren

elevenlabs-music setzt auf die infsh CLI. Folge den offiziellen Installationshinweisen aus dem Repo:

CLI-Installationsanleitung: https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md

Prüfe nach der Installation, ob alles funktioniert:

infsh --help

Wenn das Kommando eine Hilfeseite ausgibt, ist deine CLI bereit.

2. Bei inference.sh anmelden

Bevor du Musik generierst, authentifiziere deine CLI-Session:

infsh login

Folge den interaktiven Anweisungen, um den Login abzuschließen. Dadurch wird infsh mit deinem inference.sh Account verknüpft und der Zugriff auf die elevenlabs/music App aktiviert.

3. Deinen ersten KI-Musiktrack erzeugen

Einfaches Text-to-Music-Kommando

Sobald du eingeloggt bist, kannst du mit einem einfachen Prompt direkt Musik generieren:

infsh app run elevenlabs/music --input '{"prompt": "Upbeat electronic dance track with driving synths"}'

Dieses Kommando sendet deine Beschreibung über inference.sh an das ElevenLabs Music Model. Die Ausgabe ist JSON mit Verweisen auf das erzeugte Audio (z. B. URLs oder Dateimetadaten – je nach deiner CLI-Konfiguration).

4. Länge und Stil steuern

Das elevenlabs-music Skill stellt Parameter der zugrunde liegenden App bereit, mit denen du die Ergebnisse feintunen kannst.

Verfügbare Parameter

prompt (string, erforderlich)
- Eine natürliche Sprachbeschreibung der gewünschten Musik (max. 2000 Zeichen).
- Idealerweise inklusive Genre, Stimmung, Tempo und Instrumenten.
duration_seconds (number, optional)
- Standardwert: 30
- Minimum: 5, Maximum: 600 (bis zu 10 Minuten)

Anwendungsbeispiele

Beispiel: kurzer Background-Sting (10 Sekunden)

infsh app run elevenlabs/music --input '{
  "prompt": "Short cinematic logo sting with orchestral hit and subtle whoosh",
  "duration_seconds": 10
}'

Beispiel: Lo-Fi Study Beats (2 Minuten)

infsh app run elevenlabs/music --input '{
  "prompt": "Lo-fi hip hop beat, chill study music, vinyl crackle, mellow piano",
  "duration_seconds": 120
}'

Diese Beispiele zeigen, wie du die Dauer für Intros, Stings oder längere Hintergrundbetten anpassen kannst.

5. Ausgabe verstehen

Die ElevenLabs-Musikgenerierung läuft innerhalb der inference.sh App-Umgebung und liefert eine JSON-Ausgabe. Die genaue Struktur kann sich im Laufe der Zeit ändern, aber typischerweise findest du Keys, die auf das erzeugte Audio verweisen (etwa eine URL zur gerenderten Datei oder eine ID innerhalb von inference.sh).

Typische nächste Schritte:

JSON in deinem Script oder Agent parsen
Die Audiodatei herunterladen und in deinem Editor (DAW, Videoschnitt, Podcast-Tool) verwenden
Metadaten (Prompt, Dauer, Timestamp) zusammen mit deinen Medienassets speichern, um Tracks später nachzuvollziehen oder neu zu erzeugen

6. elevenlabs-music in Agents und Workflows einsetzen

Da dieses Skill im inferen-sh/skills-Repository definiert ist und Bash über infsh verwendet, können Agents:

infsh app run elevenlabs/music aufrufen, sobald sie eine Nutzerintention wie „Hintergrundmusik für mein Video-Intro generieren“ erkennen
prompt und duration_seconds dynamisch auf Basis der Nutzeranweisungen zusammenstellen
Den Musiklink oder Dateireferenz an den Nutzer oder nachgelagerte Tools zurückgeben

So wird elevenlabs-music nützlich für:

Mehrstufige Content-Pipelines (z. B. Script generieren → Bilder generieren → passende Musik generieren)
Chatbasierte Kreativ-Assistenten, die auf Anfrage individuelle Soundtracks liefern

7. Wichtige Dateien und Konfiguration

Nach der Installation des Skills solltest du diese Dateien im inferen-sh/skills-Repository ansehen, um das Verhalten zu verstehen oder anzupassen:

SKILL.md (Root-Ebene für dieses Skill): Überblick und Quickstart-Kommandos
tools/audio/elevenlabs-music/ (falls in deinem Clone vorhanden): Implementierungsdetails und etwaige Helper-Scripts

Diese Dateien dokumentieren, wie das Skill an die CLI angebunden ist, und erläutern Änderungen oder Updates.

FAQ

Ist elevenlabs-music kostenlos nutzbar?

elevenlabs-music selbst ist eine Skill-Definition, die sich über inference.sh mit der elevenlabs/music App verbindet. Nutzungskosten oder Limits ergeben sich aus deiner inference.sh- und ElevenLabs-Konfiguration – nicht direkt aus diesem Skill.

Prüfe vor intensiver Nutzung deinen inference.sh Account und deinen ElevenLabs-Tarif auf Preise, Quoten und Rate Limits.

Welche Art von Musik kann elevenlabs-music generieren?

Das zugrunde liegende ElevenLabs Model ist auf instrumentale und Hintergrund-Tracks ausgelegt, die über natürliche Sprachprompts gesteuert werden. Du kannst etwa beschreiben:

Genres: Lo-Fi, EDM, Cinematic, Ambient, Rock, Orchestral usw.
Stimmungen: upbeat, dark, suspenseful, relaxing, uplifting
Kontexte: Study Music, Trailer Score, Game-Level-Theme, Podcast-Intro, Ad-Bed

Nutze möglichst detaillierte Prompts (Stimmung + Genre + Instrumente + Kontext), um bessere Ergebnisse zu erzielen.

Wie lang können die generierten Tracks sein?

Du kannst duration_seconds zwischen 5 Sekunden und 600 Sekunden setzen:

Minimum: 5
Maximum: 600 (10 Minuten)

Wenn du den Parameter weglässt, beträgt die Standardlänge 30 Sekunden.

Wie ändere ich die Länge der Musik?

Füge duration_seconds in das JSON ein, das du an --input übergibst:

infsh app run elevenlabs/music --input '{
  "prompt": "Epic orchestral battle music",
  "duration_seconds": 300
}'

Passe die Zahl an die gewünschte Länge an – innerhalb der Grenzen von 5 bis 600 Sekunden.

Kann ich elevenlabs-music-Tracks kommerziell nutzen?

In der SKILL-Beschreibung wird lizenzfreie kommerzielle Nutzung als Fähigkeit der ElevenLabs KI-Musikgenerierung über inference.sh genannt. Prüfe aber immer die aktuellen Lizenzbedingungen direkt bei ElevenLabs und inference.sh, da sich Richtlinien ändern können.

Muss ich programmieren können, um elevenlabs-music zu nutzen?

Du brauchst keinen vollwertigen Anwendungscode, solltest aber vertraut sein mit:

dem Ausführen von Kommandos im Terminal
dem Übergeben von JSON über den --input Flag

Für tiefere Integrationen (z. B. in einer Web-App oder Agent-Plattform) wird dein Code typischerweise infsh aufrufen oder den Mechanismus nutzen, den dein Agent-Framework für CLI-Tools bereitstellt.

Unterstützt elevenlabs-music Stimmen oder Songtexte?

Dieses Skill ist auf Musikgenerierung aus Textprompts fokussiert, nicht auf Lyrik-Synchronisation oder Gesangsperformance. Du kannst vokalartige Texturen im Prompt beschreiben (z. B. „choir pads“ oder „vocal chops“), aber eine präzise Generierung von Melodien zu konkreten Texten liegt außerhalb des dokumentierten Funktionsumfangs.

Wo finde ich weitere Details oder Updates?

Besuche das Skill im inferen-sh/skills-Repository:

Repo: https://github.com/inferen-sh/skills
Skill-Pfad: tools/audio/elevenlabs-music

Sieh dir SKILL.md und verwandte Dateien für aktuelle Beispiele, Parameter und CLI-Hinweise an. Wenn sich CLI- oder App-Namen ändern, werden diese Dateien in der Regel zuerst aktualisiert.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

elevenlabs-dialogue

by inferen-sh

Erzeuge mit ElevenLabs über die inference.sh CLI hochwertiges, mehrstimmiges Dialog-Audio. Verwandle strukturierte Skripte in natürlich klingende Gespräche mit mehreren Stimmen in einer einzigen Datei – ideal für Podcasts, Hörbücher, Erklärvideos, Tutorials, Charakterdialoge und Videoskripte.

Voice Generation

Favorites 0GitHub 0

elevenlabs-stt

by inferen-sh

Hochpräzise ElevenLabs Speech-to-Text über die inference.sh CLI mit Scribe v1/v2 Modellen. Unterstützt Transkription, Sprecher-Diarisierung, Audio-Event-Tagging, Wortzeitstempel, Forced Alignment und Untertitel-Generierung für Meetings, Podcasts und andere Audio-Workflows.

Audio Editing

Favorites 0GitHub 0

ai-podcast-creation

by inferen-sh

Erstellen Sie KI-gestützte Podcasts und Sprachinhalte aus Text mit Kokoro TTS, DIA TTS und der inference.sh CLI. Kombinieren Sie mehrere Stimmen, fügen Sie Musik hinzu und bauen Sie komplette Episoden für Podcasts, Hörbücher und Audio-Newsletter.

Voice Generation

Favorites 0GitHub 0

elevenlabs-tts

by inferen-sh

ElevenLabs Text-to-Speech über die inference.sh CLI, mit über 22 Premiumstimmen, Mehrsprachenunterstützung und schnellen Modelloptionen für produktive Voice-Generation-Workflows.

Voice Generation

Favorites 0GitHub 0

elevenlabs-dubbing

by inferen-sh

elevenlabs-dubbing ermöglicht es dir, Audio- oder Videoinhalte automatisch in 29 Sprachen zu vertonen und zu übersetzen – direkt über die inference.sh CLI – und dabei die Stimmen der ursprünglichen Sprecher zu erhalten. Ideal für Video-Editoren, Podcaster und Lokalisierungsteams, die schnell hochwertige, mehrsprachige Versionen bestehender Inhalte benötigen.

Video Editing

Favorites 0GitHub 0

ai-content-pipeline

by inferen-sh

Entwerfen und betreiben Sie mehrstufige AI-Content-Pipelines, die Bild-, Video-, Audio- und Text-Tools über die inference.sh CLI miteinander verketten. Verwenden Sie ai-content-pipeline, um Workflows zu automatisieren wie: ein Bild generieren, zu einem Video animieren, Sound oder Voiceover hinzufügen und Inhalte für YouTube, Social Media und Marketing-Kampagnen aufbereiten.

Workflow Automation

Favorites 0GitHub 0

dialogue-audio

by inferen-sh

Erzeuge realistisch klingende Dialog-Audios mit mehreren Sprecher:innen mit Dia TTS und ElevenLabs über die inference.sh CLI. Das dialogue-audio Skill hilft dir, Sprecherrollen, Emotion, Tempo und Gesprächsverlauf für Podcasts, Hörbücher, Erklärvideos, Charakterszenen und andere dialogbasierte Inhalte präzise zu steuern.

Voice Generation

Favorites 0GitHub 0

elevenlabs-voice-isolator

by inferen-sh

CLI-basierter ElevenLabs Voice Isolator Skill zum Entfernen von Hintergrundgeräuschen und zum Isolieren von Stimmen/Vocals aus Audio über inference.sh. Ideal für Podcast-Optimierung, Interviews, Gesangsspuren, laute Aufnahmen und Audiorestaurierungs-Workflows.

Audio Editing

Favorites 0GitHub 232