elevenlabs-voice-isolator

por inferen-sh

Skill de isolamento de voz da ElevenLabs via CLI para remover ruído de fundo e isolar vocais em áudios usando o inference.sh. Ideal para limpeza de podcasts, entrevistas, vocais de música, gravações ruidosas e fluxos de trabalho de restauração de áudio.

Estrelas232

Favoritos0

Comentários0

Adicionado27 de mar. de 2026

CategoriaAudio Editing

Comando de instalação

npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-voice-isolator

Audio Cli Bash Ffmpeg

Visão geral

O que é elevenlabs-voice-isolator?

A skill elevenlabs-voice-isolator é uma ferramenta de limpeza de áudio em linha de comando que usa o app ElevenLabs Voice Isolator por meio da CLI inference.sh (infsh). O foco é remover ruído de fundo e isolar voz falada ou vocais a partir de um arquivo de áudio de entrada.

Ela é construída como uma skill reutilizável dentro do repositório inferen-sh/skills, para que você possa chamá-la em ambientes de agentes compatíveis ou diretamente do seu terminal, desde que a CLI infsh esteja configurada.

Principais capacidades

Usando o modelo ElevenLabs voice isolator via infsh, esta skill consegue:

Remover ruídos ambientes de fundo (som de sala, zumbido, trânsito, multidão)
Isolar vozes ou vocais em uma gravação ruidosa
Limpar faixas de podcast e gravações de entrevistas
Melhorar a inteligibilidade da fala em ambientes difíceis
Suportar formatos de áudio comuns (WAV, MP3, FLAC, OGG, AAC)
Processar gravações longas (até 1 hora, 500MB por arquivo conforme indicado na documentação da skill)

Para quem é esta skill?

Use elevenlabs-voice-isolator se você:

Grava podcasts e quer trilhas de voz mais limpas sem ter que fazer redução de ruído manual
Capta entrevistas remotas e precisa reduzir o ruído de fundo dos convidados
Trabalha com demos musicais ou takes de voz e quer isolar melhor a linha vocal
Mantém acervos de áudio e busca uma restauração básica focada em fala
Cria agentes de IA ou automações que precisam limpar áudio em tempo real usando uma ferramenta de CLI

Se você já usa ffmpeg ou uma DAW, mas quer uma etapa de isolamento de voz em nível mais alto, acessível pelo terminal ou por um agente, esta skill cobre exatamente essa necessidade.

Quando é uma boa escolha (e quando não é)

Boa escolha quando:

Seu objetivo principal é isolamento de voz ou limpeza de fala, não mixagem completa de áudio multifaixa.
Você se sente à vontade para executar comandos de CLI (Bash) e trabalhar com URLs ou arquivos locais.
Você pode instalar e autenticar a CLI inference.sh (infsh).

Não é a melhor escolha quando:

Você precisa de edição pesada, mixagem multifaixa ou cadeias de efeitos dentro de uma DAW com interface gráfica.
Seu fluxo de trabalho é totalmente offline e você não pode usar a CLI infsh ou chamadas a modelos externos.
Você precisa de controle extremamente detalhado, em nível de frame, sobre o processo de DSP, em vez de um isolador orientado a modelo.

Como usar

Pré-requisitos

Antes de usar elevenlabs-voice-isolator, garanta que você tem:

CLI inference.sh (infsh) instalada
- O guia rápido da skill faz referência a infsh e inclui links para as instruções de instalação da CLI.
- Siga as instruções de instalação mais recentes em:
  - https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md
Acesso ao app ElevenLabs Voice Isolator via infsh
- A skill chama elevenlabs/voice-isolator por meio de infsh app run.
Ambiente compatível com Bash
- Os allowed-tools da skill incluem Bash(infsh *), portanto ela foi pensada para shells Bash e fluxos de trabalho em CLI.

Instalação básica em um ambiente de skills para agentes

Se você está usando um ambiente que suporta npx skills e o repositório inferen-sh/skills, pode adicionar a skill com:

npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-voice-isolator
``

Isso torna a skill elevenlabs-voice-isolator disponível junto com outras ferramentas do mesmo repositório. Depois de adicioná-la, seu agente ou ferramenta pode invocar os comandos `infsh` definidos pela skill.

### Fazer login no inference.sh
Antes de rodar qualquer isolamento de voz, autentique a CLI:

```bash
infsh login

Siga as instruções exibidas para concluir o login. Essa etapa é obrigatória para que os comandos infsh app run funcionem.

Executar um comando simples de isolamento de voz

O padrão de uso principal de elevenlabs-voice-isolator via infsh é assim:

infsh app run elevenlabs/voice-isolator --input '{"audio": "https://noisy-recording.mp3"}'

Substitua https://noisy-recording.mp3 pela URL do seu próprio arquivo de áudio ruidoso. O app processa a entrada e retorna uma resposta (normalmente em JSON) com referências ao áudio limpo.

Formatos de áudio e limites suportados

De acordo com a documentação da skill, o ElevenLabs voice isolator oferece suporte a:

WAV – até 500MB, máximo de 1 hora
MP3 – até 500MB, máximo de 1 hora
FLAC – até 500MB, máximo de 1 hora
OGG – até 500MB, máximo de 1 hora
AAC – até 500MB, máximo de 1 hora

Para maior estabilidade, fique dentro desses tamanhos e durações ao preparar o áudio para o elevenlabs-voice-isolator.

Exemplo: limpar uma gravação de podcast

Este exemplo segue o cenário de início rápido da própria skill para limpeza de podcasts:

# Remove background noise from a podcast recording
infsh app run elevenlabs/voice-isolator --input '{"audio": "https://noisy-podcast.mp3"}'

Use esse padrão para qualquer conteúdo falado em que você queira narração ou diálogos mais claros. Hospede o arquivo em algum lugar acessível via HTTPS (ou siga as orientações atuais do infsh para uso de arquivo local, se isso for suportado no seu ambiente).

Exemplo: limpar uma gravação de entrevista

Para melhorar uma entrevista com ruído de sala ou sons de rua, ajuste a URL de entrada:

infsh app run elevenlabs/voice-isolator --input '{"audio": "https://noisy-interview-file.mp3"}'

Você pode integrar esse comando em scripts que limpam automaticamente cada nova gravação de entrevista antes da edição.

Integração com seus próprios tools e agentes

Como elevenlabs-voice-isolator é definida como uma skill em inferen-sh/skills:

Agentes: Um agente de IA que consegue chamar Bash(infsh *) pode usar esta skill para limpar áudio como parte de um pipeline (por exemplo, isolamento → transcrição → sumarização).
Pipelines em CLI: Você pode encapsular infsh app run elevenlabs/voice-isolator em scripts de shell, fluxos de CI ou ferramentas de processamento em lote.
Pós-produção de áudio: Use como etapa de pré-processamento antes de importar o arquivo limpo para uma DAW ou editor como Audacity, Reaper ou Adobe Audition.

Arquivos e configuração para verificar

Dentro do repositório inferen-sh/skills, abra:

tools/audio/elevenlabs-voice-isolator/SKILL.md

Esse arquivo descreve a skill, sua descrição e exemplos de comandos de uso. Não há uma configuração complexa por usuário exposta no arquivo da skill, mas a CLI e o app podem oferecer opções adicionais documentadas em outras partes do ecossistema inference.sh.

FAQ

O que exatamente elevenlabs-voice-isolator faz com o meu áudio?

A skill elevenlabs-voice-isolator envia seu áudio para o modelo ElevenLabs Voice Isolator via CLI do inference.sh. O modelo se concentra em separar e realçar a voz enquanto reduz o ruído de fundo. O resultado é um áudio em que fala ou vocais ficam mais claros e com menos ruído, adequado para podcasts, entrevistas e conteúdos similares.

Eu preciso da CLI inference.sh para usar elevenlabs-voice-isolator?

Sim. O guia rápido publicado mostra o uso pela CLI inference.sh (infsh). Você precisa instalar e autenticar o infsh antes de rodar os comandos de exemplo ou integrar a skill em um agente.

Quais formatos de áudio posso processar?

Com base na documentação da skill, elevenlabs-voice-isolator suporta:

WAV, MP3, FLAC, OGG e AAC
Até 500MB de tamanho de arquivo e 1 hora de duração por arquivo

Se seus arquivos excederem esses limites, corte ou reduza a amostragem antes de processar.

Posso rodar elevenlabs-voice-isolator em arquivos locais em vez de URLs?

Os exemplos em SKILL.md usam URLs HTTPS no campo audio. Se caminhos locais são suportados ou não depende das capacidades e configurações atuais do infsh. Confira a documentação mais recente da CLI inference.sh para saber como referenciar arquivos locais (por exemplo, via upload ou convenções de caminho local) e ajuste seu argumento --input conforme necessário.

elevenlabs-voice-isolator é adequado para produção musical?

Ele pode ajudar a isolar vocais ou limpar gravações de demo ruidosas, mas não é uma suíte completa de produção musical. Use como etapa de pré-processamento ou ferramenta utilitária, e depois finalize a mixagem e masterização detalhadas na sua DAW.

Em que isso é diferente da redução de ruído tradicional em uma DAW?

A redução de ruído tradicional em DAW costuma exigir capturas de ruído, ajustes manuais e monitoramento em tempo real. elevenlabs-voice-isolator é um processo baseado em modelo e em lote, acessado via CLI. Você envia um arquivo de áudio, o modelo faz isolamento e remoção de ruído, e você recebe um output processado. Isso é conveniente para limpeza automatizada ou em larga escala, especialmente quando combinado com agentes ou scripts.

E se eu quiser só um filtro simples de redução de ruído, sem isolamento de voz?

A skill elevenlabs-voice-isolator é focada em isolamento de voz e remoção de ruído de fundo ao mesmo tempo. Se você só precisa de um denoise básico ou de um ajuste de EQ, um filtro local do ffmpeg ou um plugin de DAW pode ser mais simples. Use esta skill quando quiser especificamente separação de voz e clareza de fala aprimorada usando o modelo da ElevenLabs.

Onde posso saber mais ou resolver problemas?

Para obter detalhes mais precisos e atualizados:

Abra tools/audio/elevenlabs-voice-isolator/SKILL.md no repositório inferen-sh/skills.
Revise o guia geral de instalação e uso do infsh em cli-install.md no mesmo repositório.
Consulte a documentação do inference.sh e da ElevenLabs para limites específicos de serviço, autenticação e códigos de erro.

Se algo falhar, comece verificando se o infsh login foi bem-sucedido, se a URL do seu áudio é acessível e se o arquivo está dentro dos formatos e limites de tamanho/duração suportados.

Avaliações e comentários

Ainda não há avaliações

Compartilhe sua avaliação

Faça login para deixar uma nota e um comentário sobre esta skill.

0/10000

Avaliações mais recentes

Salvando...

Mais skills nesta categoria

elevenlabs-sound-effects

by inferen-sh

Gere efeitos sonoros com IA a partir de prompts de texto usando ElevenLabs via a CLI do inference.sh. Ideal para editores de vídeo, desenvolvedores de jogos, podcasters, cineastas e criadores de conteúdo que precisam de sound design rápido e livre de royalties. Oferece text-to-sound-effect, duração ajustável e controle de prompt para SFX cinematográficos, ambientes e prontos para games.

Audio Editing

Favorites 0GitHub 0

ai-voice-cloning

by inferen-sh

ai-voice-cloning é um skill baseado em inference.sh para geração de voz com IA, text-to-speech e clonagem de voz via CLI. Ele integra modelos ElevenLabs, Kokoro TTS, DIA, Chatterbox, Higgs e VibeVoice para fala natural, narração com múltiplas vozes e transformação de voz em projetos de áudio e vídeo.

Voice Generation

Favorites 0GitHub 0

elevenlabs-dubbing

by inferen-sh

elevenlabs-dubbing permite dublar e traduzir automaticamente áudio ou vídeo para 29 idiomas usando a CLI do inference.sh, preservando as vozes originais dos locutores. Ideal para editores de vídeo, podcasters e equipes de localização que precisam de versões multilíngues rápidas e de alta qualidade de conteúdos já existentes.

Video Editing

Favorites 0GitHub 0

ai-content-pipeline

by inferen-sh

Crie e execute pipelines de conteúdo em IA com múltiplas etapas, encadeando ferramentas de imagem, vídeo, áudio e texto via CLI do inference.sh. Use ai-content-pipeline para automatizar fluxos como: gerar uma imagem, animá-la em vídeo, adicionar trilha sonora ou narração e preparar conteúdo para YouTube, redes sociais e campanhas de marketing.

Workflow Automation

Favorites 0GitHub 0

dialogue-audio

by inferen-sh

Crie diálogos em áudio realistas com múltiplos locutores usando Dia TTS e ElevenLabs via a CLI do inference.sh. A skill dialogue-audio ajuda você a controlar locutores, emoção, ritmo e fluxo de conversa para podcasts, audiolivros, vídeos explicativos, cenas de personagem e outros formatos conversacionais.

Voice Generation

Favorites 0GitHub 0

ai-podcast-creation

by inferen-sh

Crie podcasts e conteúdos em áudio com IA a partir de texto usando Kokoro TTS, DIA TTS e a CLI inference.sh. Combine múltiplas vozes, adicione trilhas musicais e monte episódios completos para podcasts, audiolivros e newsletters em áudio.

Voice Generation

Favorites 0GitHub 0

elevenlabs-dialogue

by inferen-sh

Gere áudios de diálogo refinados com múltiplos locutores usando ElevenLabs via a CLI do inference.sh. Transforme roteiros estruturados em conversas naturais com várias vozes em um único arquivo, ideal para podcasts, audiolivros, explicadores, tutoriais, diálogos de personagens e roteiros de vídeo.

Voice Generation

Favorites 0GitHub 0

elevenlabs-tts

by inferen-sh

Texto-para-fala da ElevenLabs via CLI do inference.sh, com mais de 22 vozes premium, suporte multilíngue e modelos rápidos para fluxos de trabalho de geração de voz em produção.

Voice Generation

Favorites 0GitHub 0