elevenlabs-music

por inferen-sh

Gere músicas originais com IA a partir de prompts em texto usando o CLI inference.sh e ElevenLabs. Controle duração, estilo e clima para criar trilhas de fundo royalty-free, trilhas sonoras, vinhetas, camas para podcasts e áudio para games diretamente pelo terminal.

Estrelas0

Favoritos0

Comentários0

Adicionado27 de mar. de 2026

CategoriaAudio Editing

Comando de instalação

npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-music

Audio Cli API Ai Developer Audience

Visão geral

O que é elevenlabs-music?

elevenlabs-music é uma skill de geração de música com IA focada em linha de comando, que conecta seu agente ou fluxo de trabalho no terminal ao modelo de música da ElevenLabs por meio do CLI inference.sh (infsh).

Com um prompt de texto curto, você gera músicas originais e royalty-free sob medida para o seu projeto. A skill encapsula o app elevenlabs/music no inference.sh, permitindo que você:

Transforme descrições em texto em música (text-to-music)
Controle a duração da faixa de 5 segundos até 10 minutos
Direcione gênero, clima e instrumentação dentro do seu prompt
Produza áudio adequado para uso comercial, como vídeos, podcasts e games

Para quem é esta skill?

elevenlabs-music foi pensada para:

Criadores e editores que precisam de trilhas de fundo sob medida, rápidas, para YouTube, TikTok, lives, podcasts ou trailers
Desenvolvedores de games e apps que querem camas musicais adaptativas e sob demanda para fases, menus ou experiências in-app
Times de marketing e branding criando jingles, vinhetas curtas e músicas amigáveis para anúncios sem precisar contratar um compositor para cada variação
Desenvolvedores e criadores de agentes que buscam uma interface previsível em estilo CLI/API para gerar música dentro de scripts, automações ou agentes de IA

Se você já usa inference.sh ou monta fluxos em torno de ferramentas de linha de comando, elevenlabs-music se encaixa naturalmente no seu stack.

Que problemas o elevenlabs-music resolve?

Esta skill ajuda quando você precisa de:

Música rápida e royalty-free, sem garimpar bibliotecas de stock
Estilo consistente sob demanda (por exemplo, várias faixas com o mesmo clima para uma série)
Criação de áudio pronta para automação, em que um agente ou script gera música em resposta a entrada do usuário ou metadados de conteúdo

Como roda via infsh app run elevenlabs/music, você pode integrá-la em shell scripts, pipelines de CI ou agentes em chat sem precisar criar uma camada de API personalizada.

Quando o elevenlabs-music é uma boa opção?

Use elevenlabs-music quando:

Você se sente à vontade com comandos básicos de CLI ou com ferramentas de agente que chamam a CLI
Você quer gerar trilhas de fundo, ambiências ou vinhetas simples mais do que músicas vocais totalmente estruturadas
Você precisa de iteração rápida: testar vários prompts e durações até encontrar a faixa certa

Pode ser menos adequado se:

Você precisa de arranjo musical detalhado (compassos, mapas de tempo, progressões de acordes) controlado programaticamente
Você precisa de voz cantada, sincronização de letras ou exportação multi-stem (por exemplo, pistas separadas de bateria, baixo, vocal)
Você não quer usar o CLI inference.sh de forma alguma — esta skill depende do infsh

Como usar

1. Pré-requisitos e instalação

Verifique seu ambiente

Antes de usar elevenlabs-music, certifique-se de ter:

Um sistema onde seja possível instalar e rodar o CLI inference.sh (infsh)
Acesso à rede para que o infsh possa chamar o app elevenlabs/music com tecnologia ElevenLabs

Instale a skill no ambiente do seu agente

Se você estiver usando o carregador de skills descrito no repositório inferen-sh/skills, instale elevenlabs-music com:

npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-music

Esse comando baixa a definição da skill do repositório e a torna disponível para suas ferramentas de agente.

Instale o CLI inference.sh

elevenlabs-music depende do CLI infsh. Siga as instruções oficiais de instalação no repositório:

Guia de instalação do CLI: https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md

Após instalar, verifique se está funcionando:

infsh --help

Se o comando responder com o texto de ajuda, o CLI está pronto para uso.

Antes de gerar música, autentique sua sessão do CLI:

infsh login

Siga os prompts interativos para concluir o login. Isso vincula o infsh à sua conta inference.sh e libera o acesso ao app elevenlabs/music.

3. Gere sua primeira faixa de música com IA

Comando básico de text-to-music

Depois de logado, você já pode gerar música com um prompt simples:

infsh app run elevenlabs/music --input '{"prompt": "Upbeat electronic dance track with driving synths"}'

Esse comando envia sua descrição para o modelo de música da ElevenLabs via inference.sh. A saída será um JSON contendo referências ao áudio gerado (como URLs ou metadados de arquivo, dependendo da configuração do CLI).

4. Controle de duração e estilo

A skill elevenlabs-music expõe parâmetros do app subjacente para você ajustar os resultados.

Parâmetros disponíveis

prompt (string, obrigatório)
- Uma descrição em linguagem natural da música que você quer (até 2000 caracteres).
- Inclua gênero, clima, tempo e instrumentos sempre que possível.
duration_seconds (number, opcional)
- Padrão: 30
- Mínimo: 5, Máximo: 600 (até 10 minutos)

Exemplos de uso

Exemplo: vinheta curta de fundo (10 segundos)

infsh app run elevenlabs/music --input '{
  "prompt": "Short cinematic logo sting with orchestral hit and subtle whoosh",
  "duration_seconds": 10
}'

Exemplo: lo-fi study beats (2 minutos)

infsh app run elevenlabs/music --input '{
  "prompt": "Lo-fi hip hop beat, chill study music, vinyl crackle, mellow piano",
  "duration_seconds": 120
}'

Esses exemplos mostram como ajustar a duração para intros, stingers ou camas de fundo mais longas.

5. Interpretando a saída

A geração de música da ElevenLabs roda dentro do ambiente de app do inference.sh e retorna saída em JSON. Embora a estrutura exata possa mudar ao longo do tempo, em geral você verá chaves que fazem referência ao áudio gerado (por exemplo, uma URL do arquivo renderizado ou um ID dentro do inference.sh).

Próximos passos típicos:

Fazer o parse do JSON no seu script ou agente
Baixar o arquivo de áudio para usar no seu editor (DAW, editor de vídeo, ferramenta de podcast)
Armazenar metadados (prompt, duração, timestamp) junto aos seus ativos de mídia para re-geração ou documentação futura

6. Usando elevenlabs-music dentro de agentes e fluxos de trabalho

Como esta skill está definida no repositório inferen-sh/skills e marcada para usar Bash via infsh, os agentes podem:

Chamar infsh app run elevenlabs/music quando detectarem uma intenção como “gerar música de fundo para a abertura do meu vídeo”
Montar dinamicamente o prompt e o duration_seconds com base nas instruções do usuário
Retornar o link ou a referência ao arquivo de música para o usuário ou para ferramentas seguintes no fluxo

Isso torna elevenlabs-music útil para:

Pipelines de conteúdo em múltiplas etapas (por exemplo, gerar roteiro → gerar imagens → gerar música correspondente)
Assistentes criativos baseados em chat que entregam trilhas personalizadas sob demanda

7. Arquivos e configurações para revisar

Depois de instalar a skill, abra estes arquivos no repositório inferen-sh/skills para entender ou personalizar o comportamento:

SKILL.md (no nível raiz desta skill): descrição de alto nível e comandos de quick start
tools/audio/elevenlabs-music/ (se existir no seu clone): detalhes de implementação e eventuais scripts auxiliares

Esses arquivos documentam como a skill está conectada ao CLI e esclarecem mudanças ou atualizações.

Perguntas frequentes (FAQ)

O elevenlabs-music é gratuito?

elevenlabs-music em si é uma definição de skill que se conecta ao app elevenlabs/music via inference.sh. Quaisquer custos de uso ou limites vêm da sua configuração no inference.sh e na ElevenLabs, não diretamente desta skill.

Confira sua conta inference.sh e seu plano ElevenLabs para entender preços, cotas e limites de taxa antes de um uso intenso.

Que tipo de música o elevenlabs-music consegue gerar?

O modelo ElevenLabs usado aqui é voltado para faixas instrumentais e de fundo, guiadas por prompts em linguagem natural. Você pode descrever, por exemplo:

Gêneros: lo-fi, EDM, cinematic, ambient, rock, orchestral etc.
Climas: upbeat, dark, suspenseful, relaxing, uplifting
Contextos: música para estudo, trilha de trailer, tema de fase de game, intro de podcast, cama para anúncio

Use prompts detalhados (clima + gênero + instrumentos + contexto) para obter resultados melhores.

Qual é a duração máxima das faixas geradas?

Você pode definir duration_seconds entre 5 segundos e 600 segundos:

Mínimo: 5
Máximo: 600 (10 minutos)

Se você não informar o parâmetro, o padrão é 30 segundos.

Como eu altero a duração da música?

Inclua duration_seconds no JSON que você passa para --input:

infsh app run elevenlabs/music --input '{
  "prompt": "Epic orchestral battle music",
  "duration_seconds": 300
}'

Ajuste o número para o comprimento que você precisa, dentro do limite de 5–600 segundos.

Posso usar as faixas do elevenlabs-music comercialmente?

A descrição da SKILL indica uso comercial royalty-free como uma capacidade da geração de música com IA da ElevenLabs via inference.sh. No entanto, sempre confirme as licenças e termos atuais diretamente com a ElevenLabs e com o inference.sh, pois as políticas podem mudar.

Preciso programar para usar o elevenlabs-music?

Você não precisa escrever uma aplicação completa, mas é importante ter familiaridade com:

Rodar comandos no terminal
Fornecer entrada em JSON por meio da flag --input

Para integrações mais profundas (por exemplo, dentro de um web app ou plataforma de agentes), seu código normalmente vai chamar o infsh via shell ou usar o mecanismo que seu framework de agentes oferece para acionar ferramentas de CLI.

O elevenlabs-music suporta voz ou letras?

Esta skill é focada em geração de música a partir de prompts em texto, não em alinhamento de letras ou performance vocal. Você pode descrever texturas semelhantes a voz no prompt (por exemplo, “choir pads” ou “vocal chops”), mas geração precisa de melodia com letra está fora do escopo documentado desta skill.

Onde encontro mais detalhes ou atualizações?

Acesse a skill no repositório inferen-sh/skills:

Repo: https://github.com/inferen-sh/skills
Caminho da skill: tools/audio/elevenlabs-music

Consulte SKILL.md e arquivos relacionados para ver os exemplos mais recentes, parâmetros e notas de uso do CLI. Se o CLI ou o nome do app mudar, esses arquivos costumam ser atualizados primeiro.

Avaliações e comentários

Ainda não há avaliações

Compartilhe sua avaliação

Faça login para deixar uma nota e um comentário sobre esta skill.

0/10000

Avaliações mais recentes

Salvando...

Mais skills nesta categoria

elevenlabs-tts

by inferen-sh

Texto-para-fala da ElevenLabs via CLI do inference.sh, com mais de 22 vozes premium, suporte multilíngue e modelos rápidos para fluxos de trabalho de geração de voz em produção.

Voice Generation

Favorites 0GitHub 0

elevenlabs-sound-effects

by inferen-sh

Gere efeitos sonoros com IA a partir de prompts de texto usando ElevenLabs via a CLI do inference.sh. Ideal para editores de vídeo, desenvolvedores de jogos, podcasters, cineastas e criadores de conteúdo que precisam de sound design rápido e livre de royalties. Oferece text-to-sound-effect, duração ajustável e controle de prompt para SFX cinematográficos, ambientes e prontos para games.

Audio Editing

Favorites 0GitHub 0

ai-music-generation

by inferen-sh

Gere música com IA e músicas completas a partir de prompts de texto usando ElevenLabs Music, Diffrythm e Tencent Song Generation via o CLI inference.sh. Ideal para trilhas de fundo, soundtracks, clipes para redes sociais, podcasts e músicas royalty-free. Suporta geração rápida de faixas, instrumentais e músicas completas com vocais.

Voice Generation

Favorites 0GitHub 0

ai-podcast-creation

by inferen-sh

Crie podcasts e conteúdos em áudio com IA a partir de texto usando Kokoro TTS, DIA TTS e a CLI inference.sh. Combine múltiplas vozes, adicione trilhas musicais e monte episódios completos para podcasts, audiolivros e newsletters em áudio.

Voice Generation

Favorites 0GitHub 0

dialogue-audio

by inferen-sh

Crie diálogos em áudio realistas com múltiplos locutores usando Dia TTS e ElevenLabs via a CLI do inference.sh. A skill dialogue-audio ajuda você a controlar locutores, emoção, ritmo e fluxo de conversa para podcasts, audiolivros, vídeos explicativos, cenas de personagem e outros formatos conversacionais.

Voice Generation

Favorites 0GitHub 0

ai-voice-cloning

by inferen-sh

ai-voice-cloning é um skill baseado em inference.sh para geração de voz com IA, text-to-speech e clonagem de voz via CLI. Ele integra modelos ElevenLabs, Kokoro TTS, DIA, Chatterbox, Higgs e VibeVoice para fala natural, narração com múltiplas vozes e transformação de voz em projetos de áudio e vídeo.

Voice Generation

Favorites 0GitHub 0

elevenlabs-dialogue

by inferen-sh

Gere áudios de diálogo refinados com múltiplos locutores usando ElevenLabs via a CLI do inference.sh. Transforme roteiros estruturados em conversas naturais com várias vozes em um único arquivo, ideal para podcasts, audiolivros, explicadores, tutoriais, diálogos de personagens e roteiros de vídeo.

Voice Generation

Favorites 0GitHub 0

elevenlabs-stt

by inferen-sh

Reconhecimento de fala em texto de alta precisão com ElevenLabs via CLI do inference.sh, usando os modelos Scribe v1/v2. Oferece transcrição, diarização de falantes, marcação de eventos de áudio, timestamps em nível de palavra, forced alignment e geração de legendas para reuniões, podcasts e outros fluxos de trabalho de áudio.

Audio Editing

Favorites 0GitHub 0

elevenlabs-music

Visão geral

O que é elevenlabs-music?

Para quem é esta skill?

Que problemas o elevenlabs-music resolve?

Quando o elevenlabs-music é uma boa opção?

Como usar

1. Pré-requisitos e instalação

Verifique seu ambiente

Instale a skill no ambiente do seu agente

Instale o CLI inference.sh

2. Faça login no inference.sh

3. Gere sua primeira faixa de música com IA

Comando básico de text-to-music

4. Controle de duração e estilo

Parâmetros disponíveis

Exemplos de uso

5. Interpretando a saída

6. Usando elevenlabs-music dentro de agentes e fluxos de trabalho

7. Arquivos e configurações para revisar

Perguntas frequentes (FAQ)

O elevenlabs-music é gratuito?

Que tipo de música o elevenlabs-music consegue gerar?

Qual é a duração máxima das faixas geradas?

Como eu altero a duração da música?

Posso usar as faixas do elevenlabs-music comercialmente?

Preciso programar para usar o elevenlabs-music?

O elevenlabs-music suporta voz ou letras?

Onde encontro mais detalhes ou atualizações?

Avaliações e comentários