elevenlabs-voice-isolator

por inferen-sh

Skill de aislamiento de voz de ElevenLabs, controlada por CLI, para eliminar ruido de fondo y aislar voces de archivos de audio mediante inference.sh. Ideal para limpiar podcasts, entrevistas, voces en música, grabaciones ruidosas y flujos de trabajo de restauración de audio.

Estrellas232

Favoritos0

Comentarios0

Agregado27 mar 2026

CategoríaAudio Editing

Comando de instalación

npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-voice-isolator

Audio Cli

Resumen

Descripción general

¿Qué es elevenlabs-voice-isolator?

La elevenlabs-voice-isolator skill es una herramienta de limpieza de audio por línea de comandos que utiliza la app ElevenLabs Voice Isolator a través de la CLI de inference.sh (infsh). Está centrada en eliminar ruido de fondo y aislar la voz hablada o las voces cantadas a partir de un archivo de audio de entrada.

Está construida como una skill reutilizable dentro del repositorio inferen-sh/skills, de modo que puedes llamarla desde entornos de agentes compatibles o desde tu propio terminal siempre que tengas configurada la CLI infsh.

Capacidades clave

Usando el modelo de ElevenLabs voice isolator a través de infsh, esta skill puede:

Eliminar ruido de fondo ambiental (sonido de sala, zumbidos, tráfico, ruido de gente)
Aislar voces o líneas vocales de una grabación ruidosa
Limpiar pistas de podcast y grabaciones de entrevistas
Mejorar la inteligibilidad del habla en entornos difíciles
Admitir formatos de audio comunes (WAV, MP3, FLAC, OGG, AAC)
Manejar grabaciones largas (hasta 1 hora, 500MB por archivo según se indica en la documentación de la skill)

¿Para quién es esta skill?

Usa elevenlabs-voice-isolator si:

Grabas podcasts y quieres pistas de voz más limpias sin reducción de ruido manual
Registras entrevistas remotas y necesitas reducir el ruido de fondo de los invitados
Trabajas con maquetas musicales o tomas vocales y quieres aislar mejor la línea vocal
Mantienes archivos de audio y buscas una restauración básica centrada en la voz
Creas agentes de IA o automatizaciones que necesiten limpiar audio al vuelo mediante una herramienta de CLI

Si ya utilizas ffmpeg o un DAW pero quieres un paso de aislamiento de voz de más alto nivel accesible desde el terminal o desde un agente, esta skill encaja bien en ese hueco.

Cuándo encaja bien (y cuándo no)

Es una buena opción cuando:

Tu objetivo principal es el aislamiento de voz o la limpieza del habla, no la mezcla completa de audio multicanal.
Te sientes cómodo ejecutando comandos de CLI (Bash) y trabajando con URLs o archivos locales.
Puedes instalar y autenticar la CLI de inference.sh (infsh).

No es la mejor opción cuando:

Necesitas edición profunda, mezcla multicanal o cadenas de efectos dentro de un DAW con interfaz gráfica.
Tu flujo de trabajo es completamente offline y no puedes usar la CLI infsh ni llamadas a modelos externos.
Requieres un control muy detallado, a nivel de frames, sobre el proceso DSP en lugar de un aislador basado en modelo.

Cómo usarla

Requisitos previos

Antes de usar elevenlabs-voice-isolator, asegúrate de disponer de:

CLI de inference.sh (infsh) instalada
- El inicio rápido de la skill hace referencia a infsh y enlaza a las instrucciones de instalación de la CLI.
- Sigue las instrucciones de instalación más recientes en:
  - https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md
Acceso a la app ElevenLabs Voice Isolator vía infsh
- La skill llama a elevenlabs/voice-isolator mediante infsh app run.
Entorno compatible con Bash
- Los allowed-tools de la skill incluyen Bash(infsh *), por lo que está diseñada para shells Bash y flujos de trabajo por CLI.

Instalación básica en un entorno de agent skills

Si utilizas un entorno que admite npx skills y el repositorio inferen-sh/skills, puedes añadir la skill con:

npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-voice-isolator
``

Esto pone la skill elevenlabs-voice-isolator a tu disposición junto con otras herramientas del mismo repositorio. Una vez añadida, tu agente o tooling puede invocar los comandos `infsh` definidos por la skill.

### Iniciar sesión en inference.sh
Antes de ejecutar cualquier aislamiento de voz, autentica la CLI:

```bash
infsh login

Sigue las indicaciones para completar el inicio de sesión. Este paso es obligatorio para que los comandos posteriores infsh app run funcionen.

Ejecutar un comando sencillo de aislamiento de voz

El patrón de uso básico de elevenlabs-voice-isolator a través de infsh se ve así:

infsh app run elevenlabs/voice-isolator --input '{"audio": "https://noisy-recording.mp3"}'

Sustituye https://noisy-recording.mp3 por la URL de tu propio archivo de audio ruidoso. La app procesa la entrada y devuelve una respuesta (normalmente JSON) con referencias al audio ya limpio.

Formatos de audio admitidos y límites

Según la documentación de la skill, el aislador de voz de ElevenLabs admite:

WAV – hasta 500MB, máximo 1 hora
MP3 – hasta 500MB, máximo 1 hora
FLAC – hasta 500MB, máximo 1 hora
OGG – hasta 500MB, máximo 1 hora
AAC – hasta 500MB, máximo 1 hora

Para mayor estabilidad, mantén tus archivos dentro de estos tamaños y duraciones cuando prepares audio para elevenlabs-voice-isolator.

Ejemplo: Limpiar una grabación de podcast

Este ejemplo refleja el escenario de inicio rápido de la skill para limpieza de podcasts:

# Remove background noise from a podcast recording
infsh app run elevenlabs/voice-isolator --input '{"audio": "https://noisy-podcast.mp3"}'

Usa este patrón para cualquier contenido hablado en el que quieras una narración o diálogo más claros. Aloja tu archivo en un lugar accesible por HTTPS (o sigue las indicaciones actuales de infsh para el uso de archivos locales si tu entorno lo admite).

Ejemplo: Limpiar una grabación de entrevista

Para mejorar una entrevista con ruido de sala o sonidos de la calle, ajusta la URL de entrada:

infsh app run elevenlabs/voice-isolator --input '{"audio": "https://noisy-interview-file.mp3"}'

Puedes integrar este comando en scripts que limpien automáticamente cada nueva grabación de entrevista antes de la edición.

Integración con tus propias herramientas y agentes

Como elevenlabs-voice-isolator está definida como una skill en inferen-sh/skills:

Agentes: Un agente de IA que pueda llamar a Bash(infsh *) puede usar esta skill para limpiar audio como parte de una cadena de procesos (por ejemplo, aislamiento → transcripción → resumen).
Pipelines de CLI: Puedes encapsular infsh app run elevenlabs/voice-isolator dentro de scripts de shell, flujos de CI o herramientas de procesamiento por lotes.
Postproducción de audio: Úsala como paso de preprocesado antes de importar el archivo limpio en un DAW o editor como Audacity, Reaper o Adobe Audition.

Archivos y configuración a revisar

Dentro del repositorio inferen-sh/skills, abre:

tools/audio/elevenlabs-voice-isolator/SKILL.md

Este archivo describe la skill, su descripción y los comandos de ejemplo. No hay una configuración compleja por usuario expuesta en el archivo de la skill, pero la CLI y la app pueden ofrecer opciones adicionales documentadas en otras partes del ecosistema de inference.sh.

Preguntas frecuentes

¿Qué hace exactamente elevenlabs-voice-isolator con mi audio?

La skill elevenlabs-voice-isolator envía tu audio al modelo ElevenLabs Voice Isolator a través de la CLI de inference.sh. El modelo se centra en separar y realzar la voz mientras reduce el ruido de fondo. El resultado es un audio en el que el habla o las voces son más claras y con menos ruido, adecuado para podcasts, entrevistas y contenido similar.

¿Necesito la CLI de inference.sh para usar elevenlabs-voice-isolator?

Sí. El inicio rápido publicado muestra el uso a través de la CLI de inference.sh (infsh). Debes instalar y autenticar infsh antes de ejecutar los comandos de ejemplo o integrar la skill en un agente.

¿Qué formatos de audio puedo procesar?

Según la documentación de la skill, elevenlabs-voice-isolator admite:

WAV, MP3, FLAC, OGG y AAC
Hasta 500MB de tamaño por archivo y 1 hora de duración por archivo

Si tus archivos superan estos límites, recórtalos o reduce su tamaño antes de procesarlos.

¿Puedo ejecutar elevenlabs-voice-isolator sobre archivos locales en lugar de URLs?

Los ejemplos en SKILL.md usan URLs HTTPS para el campo audio. Que se admitan rutas locales o no depende de las capacidades y configuración actuales de infsh. Consulta la documentación más reciente de la CLI de inference.sh para ver cómo referenciar archivos locales (por ejemplo, mediante subida o convenciones de ruta local) y adapta tu argumento --input en consecuencia.

¿Es elevenlabs-voice-isolator adecuada para producción musical?

Puede resultar útil para aislar voces o limpiar maquetas ruidosas, pero no es una suite completa de producción musical. Úsala como paso de preprocesado o utilidad y realiza la mezcla y masterización detalladas en tu DAW.

¿En qué se diferencia de la reducción de ruido tradicional en un DAW?

La reducción de ruido tradicional en un DAW suele requerir capturas de ruido, ajustes manuales y monitorización en tiempo real. elevenlabs-voice-isolator es un proceso por lotes, basado en modelo, al que se accede vía CLI. Envías un archivo de audio, el modelo realiza el aislamiento y la eliminación de ruido y recibes un resultado procesado. Esto es muy práctico para limpiezas automatizadas o a gran escala, especialmente cuando se combina con agentes o scripts.

¿Y si solo quiero un filtro sencillo de reducción de ruido sin aislamiento de voz?

La skill elevenlabs-voice-isolator se centra en el aislamiento de voz y la eliminación de ruido de fondo de forma conjunta. Si solo necesitas una desnoisificación básica o un ajuste de EQ, puede resultar más sencillo usar un filtro local de ffmpeg o un plugin de tu DAW. Utiliza esta skill cuando busques específicamente separación de la voz y mayor claridad del habla impulsadas por el modelo de ElevenLabs.

¿Dónde puedo obtener más información o solucionar problemas?

Para obtener detalles más precisos y actualizados:

Abre tools/audio/elevenlabs-voice-isolator/SKILL.md en el repositorio inferen-sh/skills.
Revisa la guía general de instalación y uso de infsh en cli-install.md dentro del mismo repositorio.
Consulta la documentación de inference.sh y ElevenLabs para conocer límites del servicio, autenticación y códigos de error.

Si algo falla, empieza por comprobar que infsh login se completa correctamente, que tu URL de audio es accesible y que tu archivo respeta los formatos admitidos y los límites de tamaño/duración.

Calificaciones y reseñas

Aún no hay calificaciones

Comparte tu reseña

Inicia sesión para dejar una calificación y un comentario sobre esta skill.

0/10000

Reseñas más recientes

Guardando...

Más skills de esta categoría

two-factor-authentication-best-practices

by better-auth

Agrega TOTP, entrega de OTP, códigos de respaldo y gestión de dispositivos confiables a tu flujo Better Auth con la skill twoFactor. Ideal para mejorar el control de acceso y la seguridad en el inicio de sesión.

Access Control

Favorites 0GitHub 0

architecture-patterns

by wshobson

Implementa patrones de arquitectura backend probados como Clean Architecture, Hexagonal Architecture y Domain-Driven Design. Ideal para estructurar nuevos microservicios, refactorizar monolitos y establecer límites claros entre servicios en sistemas backend.

Backend Development

Favorites 0GitHub 32,4 mil

responsive-design

by wshobson

responsive-design permite diseños UI adaptativos modernos usando container queries, tipografía fluida, CSS Grid y estrategias mobile-first para puntos de quiebre. Ideal para diseñadores y desarrolladores que crean interfaces que escalan en dispositivos y tamaños de pantalla.

UI Design

Favorites 0GitHub 0

frontend-design

by pbakaus

Crea interfaces frontend distintivas y de nivel productivo con alta calidad de diseño. Genera código creativo y pulido que evita estéticas genéricas de IA. Úsalo cuando el usuario solicite construir componentes web, páginas, artefactos, carteles o aplicaciones, o cuando cualquier habilidad de diseño requiera contexto del proyecto.

UI Design

Favorites 0GitHub 14,1 mil

nextjs-app-router-patterns

by wshobson

Domina Next.js 14+ App Router con Server Components, streaming, rutas paralelas y obtención avanzada de datos. Ideal para construir, migrar u optimizar aplicaciones Next.js modernas.

Frontend Development

Favorites 0GitHub 32,4 mil

nft-standards

by wshobson

Implementa estándares NFT (ERC-721, ERC-1155) con metadatos, minting e integración con marketplaces. Ideal para contratos NFT, marketplaces y sistemas de activos digitales.

Backend Development

Favorites 0GitHub 0

overdrive

by pbakaus

Lleva las interfaces web más allá de los límites convencionales usando técnicas frontend avanzadas como shaders, física y animaciones de alto rendimiento. Ideal para proyectos que buscan crear experiencias de usuario extraordinarias, cinematográficas y altamente interactivas.

Frontend Development

Favorites 0GitHub 0

backtesting-frameworks

by wshobson

Construye sistemas robustos de backtesting para estrategias de trading con manejo adecuado del sesgo de anticipación, sesgo de supervivencia y costos de transacción. Úsalo al desarrollar algoritmos de trading, validar estrategias o construir infraestructura de backtesting.

Backend Development

Favorites 0GitHub 32,4 mil