I

elevenlabs-dubbing

por inferen-sh

elevenlabs-dubbing te permite doblar y traducir automáticamente audio o vídeo a 29 idiomas usando la CLI de inference.sh, preservando las voces originales de los locutores. Es ideal para editores de vídeo, podcasters y equipos de localización que necesitan versiones multilingües rápidas y de alta calidad de contenido ya existente.

Estrellas0
Favoritos0
Comentarios0
Agregado27 mar 2026
CategoríaVideo Editing
Comando de instalación
npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-dubbing
Resumen

Descripción general

¿Qué es elevenlabs-dubbing?

elevenlabs-dubbing es una skill de doblaje automatizado que utiliza la CLI de inference.sh para traducir y doblar audio o vídeo a 29 idiomas, preservando las voces originales de los locutores. Envuelve el flujo de doblaje de ElevenLabs en un workflow sencillo por CLI para que puedas localizar rápidamente medios existentes para audiencias globales.

En lugar de exportar el audio manualmente, enviarlo a herramientas separadas y volver a sincronizar las pistas en tu editor, puedes lanzar un solo comando que:

  • Detecta los locutores en el material de origen
  • Traduce el discurso al idioma de destino
  • Genera audio doblado natural manteniendo las voces originales de los locutores
  • Produce una pista de audio localizada y terminada (y funciona sin problemas con archivos de vídeo)

¿Para quién es elevenlabs-dubbing?

elevenlabs-dubbing encaja bien si:

  • Editas o produces contenido en vídeo y necesitas doblajes multilingües (canales de YouTube, cursos, recorridos de producto, vídeos de marketing)
  • Tienes un podcast o programa de audio y quieres versiones localizadas para nuevas regiones
  • Trabajas en equipos de localización o postproducción y necesitas escalar el doblaje sin contratar locutores nativos para cada idioma
  • Construyes workflows de medios automatizados y quieres un paso de doblaje compatible con CLI/API que puedas scriptar o ejecutar en CI

Es menos adecuado si:

  • Necesitas diseño sonoro con mezcla manual, precisión al fotograma o reinterpretación creativa en lugar de una traducción directa
  • Requieres procesamiento sin conexión a internet (inference.sh funciona como servicio en la nube)
  • Debes integrarlo directamente en una NLE con interfaz gráfica (esta skill se maneja por CLI y está pensada para usarse junto a tu editor, no dentro de él)

Capacidades clave

Basado en la definición de la skill upstream, elevenlabs-dubbing ofrece:

  • Doblaje automático para audio y vídeo mediante la CLI infsh
  • Traducción a 29 idiomas, controlada con un simple código target_lang
  • Doblaje con preservación de voz, manteniendo la identidad de los locutores originales en el nuevo idioma
  • Gestión automática de locutores, de modo que las grabaciones con varios hablantes se procesan sin configuración por locutor
  • Localización de audio para distribución internacional, ideal para reutilizar contenido existente a gran escala

Esto se alinea muy bien con flujos de trabajo de edición de vídeo, edición de audio, traducción y generación de voz, lo que lo convierte en una herramienta versátil para postproducción o localización.

Cómo usarlo

Requisitos previos e instalación

Para usar elevenlabs-dubbing, necesitas tener instalada y autenticada la CLI de inference.sh (infsh).

  1. Instala la CLI de inference.sh
    Sigue las instrucciones oficiales del repositorio:

    • Abre la guía de instalación de la CLI en:
      https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md
    • Instala infsh para tu plataforma según se describe ahí.
  2. Inicia sesión con inference.sh
    Una vez instalada, autentica tu sesión en la CLI:

    infsh login
    

    Sigue las instrucciones en pantalla (por ejemplo, abrir una URL o pegar un token) para que la CLI pueda acceder a la app de doblaje de ElevenLabs.

  3. Añade la skill a tu entorno de agente (opcional)
    Si utilizas un entorno de agentes basado en skills, instala esta skill con:

    npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-dubbing
    

    Esto hace que el workflow de elevenlabs-dubbing esté disponible para tus agentes, utilizando igualmente la CLI infsh en segundo plano.

Flujo básico de doblaje (Inicio rápido)

Una vez que infsh está instalada y con sesión iniciada, puedes doblar un archivo de vídeo o audio a otro idioma con un solo comando.

Ejemplo: Doblar un vídeo en inglés a español

infsh app run elevenlabs/dubbing --input '{
  "audio": "https://video.mp4",
  "target_lang": "es"
}'

Cómo funciona:

  • elevenlabs/dubbing es la app de doblaje alojada que invoca la CLI.
  • audio es la URL de tu medio de origen (audio o vídeo). Puede ser un enlace https:// a un archivo como video.mp4.
  • target_lang es el código de idioma para la salida doblada (en este caso es para español).

La app procesa el medio de origen, traduce el discurso y genera audio doblado en el idioma de destino preservando las voces de los locutores.

Idiomas compatibles

La skill admite 29 idiomas mediante códigos de idioma sencillos (ejemplos de la tabla upstream):

  • en – English
  • es – Spanish
  • fr – French
  • de – German
  • it – Italian
  • pt – Portuguese
  • pl – Polish
  • hi – Hindi
  • ar – Arabic
  • ko – Korean
  • ru – Russian
  • tr – Turkish
  • nl – Dutch
  • sv – Swedish
  • da – Danish
  • fi – Finnish
  • no – Norwegian
  • cs – Czech

Consulta la tabla completa de idiomas en el SKILL.md upstream si necesitas el conjunto completo de códigos compatibles.

Patrones de uso habituales

1. Localizar vídeos de YouTube o cursos

  1. Sube tu vídeo de origen a algún lugar accesible por HTTPS (por ejemplo, un bucket de almacenamiento o una URL de alojamiento no listado).
  2. Ejecuta infsh app run elevenlabs/dubbing con la URL del vídeo y el target_lang deseado.
  3. Descarga el audio doblado y alinéalo o sustitúyelo en tu editor de vídeo (Premiere Pro, Final Cut, DaVinci Resolve, etc.).

2. Traducir podcasts y entrevistas

  1. Aloja el archivo de audio original (.mp3, .wav o vídeo con audio) en una URL pública o autorizada.
  2. Llama a elevenlabs-dubbing con esa URL y un código de idioma de destino.
  3. Publica la versión localizada como un feed o episodio independiente.

3. Scripting y automatización

Como elevenlabs-dubbing se maneja mediante la CLI, puedes:

  • Envolver el comando infsh app run en scripts de shell
  • Integrar el doblaje en pipelines de CI/CD para publicación de contenido
  • Encadenarlo con otras herramientas (por ejemplo, transcripción, recorte o scripts de formateo) dentro de un flujo de automatización más amplio

Dónde mirar en el repositorio

Si instalas la skill en un entorno de agente, explora estos archivos para más detalles:

  • SKILL.md – Descripción principal, capacidades e inicio rápido
  • tools/audio/elevenlabs-dubbing (directorio) – Ubicación de esta skill en el repositorio compartido de skills

Utiliza estos archivos como referencia de implementación en lugar de copiarlos literalmente; adapta los patrones a tu propia infraestructura, almacenamiento y requisitos de seguridad.

Preguntas frecuentes (FAQ)

¿Cuándo es una buena opción elevenlabs-dubbing?

elevenlabs-dubbing encaja especialmente bien cuando ya tienes vídeo o audio terminado o casi terminado y quieres versiones multilingües rápidas y de alta calidad sin volver a grabar:

  • Convertir un vídeo exitoso en inglés en versiones en español, francés o alemán
  • Localizar webinars, tutoriales o contenido de e‑learning
  • Ampliar podcasts o entrevistas a nuevos mercados idiomáticos

Destaca cuando valoras la rapidez, la escalabilidad y la preservación de la voz del locutor por encima de un doblaje de estudio totalmente a medida.

¿Cuándo no es ideal elevenlabs-dubbing?

Plantéate otras opciones si:

  • Necesitas una reinterpretación creativa completa (nuevos guiones, tiempos de comedia o un nuevo elenco de voces)
  • Tu workflow debe ser totalmente offline (sin llamadas a la nube)
  • Necesitas una interfaz gráfica de tipo apuntar‑y‑clic integrada directamente en tu NLE

En esos casos, puede ser más adecuado un estudio de doblaje tradicional o una solución de voz on‑premise.

¿Cómo instalo elevenlabs-dubbing?

Hay dos niveles:

  1. Instala la CLI de inference.sh siguiendo las instrucciones en:
    https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md

  2. (Opcional) Añade la skill a tu entorno de agente con:

    npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-dubbing
    

El doblaje en sí se ejecuta mediante la CLI infsh contra la app elevenlabs/dubbing.

¿Qué formatos de entrada puedo usar?

El ejemplo en el archivo SKILL upstream muestra una URL de vídeo (https://video.mp4) pasada como campo audio. Esto implica que:

  • Puedes enviar archivos de vídeo que contengan una pista de audio (por ejemplo, .mp4 con sonido)
  • La extracción de audio y el doblaje se gestionan automáticamente en la app

Para obtener mejores resultados, proporciona un material de origen limpio, bien grabado, con voz clara y mínimo ruido de fondo.

¿Cómo elijo el idioma para el doblaje?

Usa el campo target_lang en la entrada JSON para especificar el idioma de salida deseado:

infsh app run elevenlabs/dubbing --input '{
  "audio": "https://video.mp4",
  "target_lang": "fr"
}'

Sustituye fr por cualquiera de los códigos de idioma compatibles, como es, de, pt u otros de la lista de idiomas admitidos.

¿elevenlabs-dubbing preserva la voz original del locutor?

Sí. Según la descripción de la skill, elevenlabs-dubbing está diseñado para la traducción con preservación de voz, manteniendo la identidad vocal de los locutores originales mientras cambia el idioma. Es ideal para creadores que quieren que el público siga sintiendo que escucha a la persona original, solo que en otro idioma.

¿Cómo se relaciona elevenlabs-dubbing con las herramientas de edición de vídeo?

elevenlabs-dubbing no sustituye a tu editor de vídeo. En su lugar, actúa como un paso de doblaje especializado dentro de tu workflow:

  1. Usa tu editor para montar y finalizar el vídeo maestro.
  2. Exporta u hospeda ese archivo maestro.
  3. Ejecuta elevenlabs-dubbing mediante infsh para generar audio localizado.
  4. Reimporta o vuelve a vincular el audio doblado en tu editor para finalizar la salida en cada idioma.

Esta separación te permite mantener tu stack de edición actual mientras añades doblaje multilingüe potente como un paso automatizado.

¿Dónde puedo ver más detalles técnicos?

Abre el código fuente de la skill en el repositorio:

  • URL de GitHub: https://github.com/inferen-sh/skills/tree/main/tools/audio/elevenlabs-dubbing
  • Definición de la skill e inicio rápido: SKILL.md

Usa estos archivos para entender la configuración exacta y los ejemplos proporcionados por los mantenedores.

Calificaciones y reseñas

Aún no hay calificaciones
Comparte tu reseña
Inicia sesión para dejar una calificación y un comentario sobre esta skill.
G
0/10000
Reseñas más recientes
Guardando...