I

elevenlabs-voice-isolator

por inferen-sh

Skill de aislamiento de voz de ElevenLabs, controlada por CLI, para eliminar ruido de fondo y aislar voces de archivos de audio mediante inference.sh. Ideal para limpiar podcasts, entrevistas, voces en música, grabaciones ruidosas y flujos de trabajo de restauración de audio.

Estrellas232
Favoritos0
Comentarios0
Agregado27 mar 2026
CategoríaAudio Editing
Comando de instalación
npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-voice-isolator
Resumen

Descripción general

¿Qué es elevenlabs-voice-isolator?

La elevenlabs-voice-isolator skill es una herramienta de limpieza de audio por línea de comandos que utiliza la app ElevenLabs Voice Isolator a través de la CLI de inference.sh (infsh). Está centrada en eliminar ruido de fondo y aislar la voz hablada o las voces cantadas a partir de un archivo de audio de entrada.

Está construida como una skill reutilizable dentro del repositorio inferen-sh/skills, de modo que puedes llamarla desde entornos de agentes compatibles o desde tu propio terminal siempre que tengas configurada la CLI infsh.

Capacidades clave

Usando el modelo de ElevenLabs voice isolator a través de infsh, esta skill puede:

  • Eliminar ruido de fondo ambiental (sonido de sala, zumbidos, tráfico, ruido de gente)
  • Aislar voces o líneas vocales de una grabación ruidosa
  • Limpiar pistas de podcast y grabaciones de entrevistas
  • Mejorar la inteligibilidad del habla en entornos difíciles
  • Admitir formatos de audio comunes (WAV, MP3, FLAC, OGG, AAC)
  • Manejar grabaciones largas (hasta 1 hora, 500MB por archivo según se indica en la documentación de la skill)

¿Para quién es esta skill?

Usa elevenlabs-voice-isolator si:

  • Grabas podcasts y quieres pistas de voz más limpias sin reducción de ruido manual
  • Registras entrevistas remotas y necesitas reducir el ruido de fondo de los invitados
  • Trabajas con maquetas musicales o tomas vocales y quieres aislar mejor la línea vocal
  • Mantienes archivos de audio y buscas una restauración básica centrada en la voz
  • Creas agentes de IA o automatizaciones que necesiten limpiar audio al vuelo mediante una herramienta de CLI

Si ya utilizas ffmpeg o un DAW pero quieres un paso de aislamiento de voz de más alto nivel accesible desde el terminal o desde un agente, esta skill encaja bien en ese hueco.

Cuándo encaja bien (y cuándo no)

Es una buena opción cuando:

  • Tu objetivo principal es el aislamiento de voz o la limpieza del habla, no la mezcla completa de audio multicanal.
  • Te sientes cómodo ejecutando comandos de CLI (Bash) y trabajando con URLs o archivos locales.
  • Puedes instalar y autenticar la CLI de inference.sh (infsh).

No es la mejor opción cuando:

  • Necesitas edición profunda, mezcla multicanal o cadenas de efectos dentro de un DAW con interfaz gráfica.
  • Tu flujo de trabajo es completamente offline y no puedes usar la CLI infsh ni llamadas a modelos externos.
  • Requieres un control muy detallado, a nivel de frames, sobre el proceso DSP en lugar de un aislador basado en modelo.

Cómo usarla

Requisitos previos

Antes de usar elevenlabs-voice-isolator, asegúrate de disponer de:

  1. CLI de inference.sh (infsh) instalada

    • El inicio rápido de la skill hace referencia a infsh y enlaza a las instrucciones de instalación de la CLI.
    • Sigue las instrucciones de instalación más recientes en:
      • https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md
  2. Acceso a la app ElevenLabs Voice Isolator vía infsh

    • La skill llama a elevenlabs/voice-isolator mediante infsh app run.
  3. Entorno compatible con Bash

    • Los allowed-tools de la skill incluyen Bash(infsh *), por lo que está diseñada para shells Bash y flujos de trabajo por CLI.

Instalación básica en un entorno de agent skills

Si utilizas un entorno que admite npx skills y el repositorio inferen-sh/skills, puedes añadir la skill con:

npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-voice-isolator
``

Esto pone la skill elevenlabs-voice-isolator a tu disposición junto con otras herramientas del mismo repositorio. Una vez añadida, tu agente o tooling puede invocar los comandos `infsh` definidos por la skill.

### Iniciar sesión en inference.sh
Antes de ejecutar cualquier aislamiento de voz, autentica la CLI:

```bash
infsh login

Sigue las indicaciones para completar el inicio de sesión. Este paso es obligatorio para que los comandos posteriores infsh app run funcionen.

Ejecutar un comando sencillo de aislamiento de voz

El patrón de uso básico de elevenlabs-voice-isolator a través de infsh se ve así:

infsh app run elevenlabs/voice-isolator --input '{"audio": "https://noisy-recording.mp3"}'

Sustituye https://noisy-recording.mp3 por la URL de tu propio archivo de audio ruidoso. La app procesa la entrada y devuelve una respuesta (normalmente JSON) con referencias al audio ya limpio.

Formatos de audio admitidos y límites

Según la documentación de la skill, el aislador de voz de ElevenLabs admite:

  • WAV – hasta 500MB, máximo 1 hora
  • MP3 – hasta 500MB, máximo 1 hora
  • FLAC – hasta 500MB, máximo 1 hora
  • OGG – hasta 500MB, máximo 1 hora
  • AAC – hasta 500MB, máximo 1 hora

Para mayor estabilidad, mantén tus archivos dentro de estos tamaños y duraciones cuando prepares audio para elevenlabs-voice-isolator.

Ejemplo: Limpiar una grabación de podcast

Este ejemplo refleja el escenario de inicio rápido de la skill para limpieza de podcasts:

# Remove background noise from a podcast recording
infsh app run elevenlabs/voice-isolator --input '{"audio": "https://noisy-podcast.mp3"}'

Usa este patrón para cualquier contenido hablado en el que quieras una narración o diálogo más claros. Aloja tu archivo en un lugar accesible por HTTPS (o sigue las indicaciones actuales de infsh para el uso de archivos locales si tu entorno lo admite).

Ejemplo: Limpiar una grabación de entrevista

Para mejorar una entrevista con ruido de sala o sonidos de la calle, ajusta la URL de entrada:

infsh app run elevenlabs/voice-isolator --input '{"audio": "https://noisy-interview-file.mp3"}'

Puedes integrar este comando en scripts que limpien automáticamente cada nueva grabación de entrevista antes de la edición.

Integración con tus propias herramientas y agentes

Como elevenlabs-voice-isolator está definida como una skill en inferen-sh/skills:

  • Agentes: Un agente de IA que pueda llamar a Bash(infsh *) puede usar esta skill para limpiar audio como parte de una cadena de procesos (por ejemplo, aislamiento → transcripción → resumen).
  • Pipelines de CLI: Puedes encapsular infsh app run elevenlabs/voice-isolator dentro de scripts de shell, flujos de CI o herramientas de procesamiento por lotes.
  • Postproducción de audio: Úsala como paso de preprocesado antes de importar el archivo limpio en un DAW o editor como Audacity, Reaper o Adobe Audition.

Archivos y configuración a revisar

Dentro del repositorio inferen-sh/skills, abre:

  • tools/audio/elevenlabs-voice-isolator/SKILL.md

Este archivo describe la skill, su descripción y los comandos de ejemplo. No hay una configuración compleja por usuario expuesta en el archivo de la skill, pero la CLI y la app pueden ofrecer opciones adicionales documentadas en otras partes del ecosistema de inference.sh.

Preguntas frecuentes

¿Qué hace exactamente elevenlabs-voice-isolator con mi audio?

La skill elevenlabs-voice-isolator envía tu audio al modelo ElevenLabs Voice Isolator a través de la CLI de inference.sh. El modelo se centra en separar y realzar la voz mientras reduce el ruido de fondo. El resultado es un audio en el que el habla o las voces son más claras y con menos ruido, adecuado para podcasts, entrevistas y contenido similar.

¿Necesito la CLI de inference.sh para usar elevenlabs-voice-isolator?

Sí. El inicio rápido publicado muestra el uso a través de la CLI de inference.sh (infsh). Debes instalar y autenticar infsh antes de ejecutar los comandos de ejemplo o integrar la skill en un agente.

¿Qué formatos de audio puedo procesar?

Según la documentación de la skill, elevenlabs-voice-isolator admite:

  • WAV, MP3, FLAC, OGG y AAC
  • Hasta 500MB de tamaño por archivo y 1 hora de duración por archivo

Si tus archivos superan estos límites, recórtalos o reduce su tamaño antes de procesarlos.

¿Puedo ejecutar elevenlabs-voice-isolator sobre archivos locales en lugar de URLs?

Los ejemplos en SKILL.md usan URLs HTTPS para el campo audio. Que se admitan rutas locales o no depende de las capacidades y configuración actuales de infsh. Consulta la documentación más reciente de la CLI de inference.sh para ver cómo referenciar archivos locales (por ejemplo, mediante subida o convenciones de ruta local) y adapta tu argumento --input en consecuencia.

¿Es elevenlabs-voice-isolator adecuada para producción musical?

Puede resultar útil para aislar voces o limpiar maquetas ruidosas, pero no es una suite completa de producción musical. Úsala como paso de preprocesado o utilidad y realiza la mezcla y masterización detalladas en tu DAW.

¿En qué se diferencia de la reducción de ruido tradicional en un DAW?

La reducción de ruido tradicional en un DAW suele requerir capturas de ruido, ajustes manuales y monitorización en tiempo real. elevenlabs-voice-isolator es un proceso por lotes, basado en modelo, al que se accede vía CLI. Envías un archivo de audio, el modelo realiza el aislamiento y la eliminación de ruido y recibes un resultado procesado. Esto es muy práctico para limpiezas automatizadas o a gran escala, especialmente cuando se combina con agentes o scripts.

¿Y si solo quiero un filtro sencillo de reducción de ruido sin aislamiento de voz?

La skill elevenlabs-voice-isolator se centra en el aislamiento de voz y la eliminación de ruido de fondo de forma conjunta. Si solo necesitas una desnoisificación básica o un ajuste de EQ, puede resultar más sencillo usar un filtro local de ffmpeg o un plugin de tu DAW. Utiliza esta skill cuando busques específicamente separación de la voz y mayor claridad del habla impulsadas por el modelo de ElevenLabs.

¿Dónde puedo obtener más información o solucionar problemas?

Para obtener detalles más precisos y actualizados:

  • Abre tools/audio/elevenlabs-voice-isolator/SKILL.md en el repositorio inferen-sh/skills.
  • Revisa la guía general de instalación y uso de infsh en cli-install.md dentro del mismo repositorio.
  • Consulta la documentación de inference.sh y ElevenLabs para conocer límites del servicio, autenticación y códigos de error.

Si algo falla, empieza por comprobar que infsh login se completa correctamente, que tu URL de audio es accesible y que tu archivo respeta los formatos admitidos y los límites de tamaño/duración.

Calificaciones y reseñas

Aún no hay calificaciones
Comparte tu reseña
Inicia sesión para dejar una calificación y un comentario sobre esta skill.
G
0/10000
Reseñas más recientes
Guardando...