elevenlabs-dubbing

par inferen-sh

elevenlabs-dubbing permet de doubler et traduire automatiquement de l’audio ou de la vidéo dans 29 langues via le CLI inference.sh, tout en conservant la voix des locuteurs d’origine. Idéal pour les monteurs vidéo, podcasteurs et équipes de localisation qui ont besoin de versions multilingues rapides et de haute qualité à partir de contenus existants.

Étoiles0

Favoris0

Commentaires0

CatégorieVideo Editing

Commande d’installation

npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-dubbing

Audio Video Cli API

Vue d’ensemble

Qu’est-ce que elevenlabs-dubbing ?

elevenlabs-dubbing est une skill de doublage automatique qui utilise le CLI inference.sh pour traduire et doubler de l’audio ou de la vidéo dans 29 langues, tout en préservant la voix des locuteurs d’origine. Elle encapsule le pipeline de doublage ElevenLabs dans un workflow CLI simple, afin de localiser rapidement des contenus existants pour des audiences internationales.

Au lieu d’exporter manuellement l’audio, de l’envoyer dans différents outils, puis de resynchroniser les pistes dans votre logiciel de montage, vous pouvez lancer une seule commande qui :

Détecte les locuteurs dans la source
Traduit la parole dans la langue cible
Génère un doublage naturel dans la voix d’origine des intervenants
Produit une piste audio finalisée et localisée (et fonctionne de manière transparente avec les fichiers vidéo)

À qui s’adresse elevenlabs-dubbing ?

elevenlabs-dubbing est particulièrement adapté si vous :

Montez ou produisez des vidéos et avez besoin de doublages multilingues (chaînes YouTube, formations, démos produit, vidéos marketing)
Animez un podcast ou une émission audio et souhaitez des versions localisées pour de nouvelles régions
Travaillez dans des équipes de localisation ou de post‑production et devez industrialiser le doublage sans recruter des comédiens natifs pour chaque langue
Construisez des workflows médias automatisés et voulez une étape de doublage compatible CLI/API, scriptable ou intégrable en CI

La skill est moins adaptée si vous :

Avez besoin d’un sound design ultra‑précis au frame près, d’un mixage manuel ou d’une réinterprétation créative plutôt que d’une traduction fidèle
Devez traiter les fichiers hors ligne, sans accès Internet (inference.sh fonctionne comme un service cloud)
Souhaitez une intégration directe dans une interface graphique de montage NLE (cette skill est pilotée en CLI et s’utilise au mieux en complément de votre logiciel de montage, pas à l’intérieur)

Fonctionnalités clés

D’après la définition de la skill en amont, elevenlabs-dubbing offre :

Doublage automatique pour l’audio et la vidéo via le CLI infsh
Traduction dans 29 langues, contrôlée via un simple code target_lang
Doublage avec conservation de la voix, pour garder l’identité vocale des intervenants dans la nouvelle langue
Gestion automatique des locuteurs, pour traiter les enregistrements multi‑intervenants sans configuration par personne
Localisation audio pour la diffusion internationale, idéale pour réutiliser des contenus existants à grande échelle

Cela s’intègre particulièrement bien aux workflows de montage vidéo, montage audio, traduction et génération de voix, ce qui en fait un outil polyvalent pour la post‑production et la localisation.

Guide d’utilisation

Prérequis et installation

Pour utiliser elevenlabs-dubbing, vous devez avoir installé et authentifié le CLI inference.sh (infsh).

Installer le CLI inference.sh
Suivez les instructions officielles du dépôt :
- Ouvrez le guide d’installation du CLI :
  https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md
- Installez infsh pour votre plateforme comme indiqué.
Se connecter à inference.sh
Une fois le CLI installé, authentifiez votre session :
```
infsh login
```
Suivez les instructions affichées (par exemple, ouverture d’une URL ou saisie d’un token) pour que le CLI puisse accéder à l’app de doublage ElevenLabs.
Ajouter la skill à votre environnement d’agent (optionnel)
Si vous utilisez un environnement d’agents basé sur des skills, installez cette skill avec :
```
npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-dubbing
```
Cela rend le workflow elevenlabs-dubbing disponible pour vos agents, tout en s’appuyant sur le CLI infsh en arrière‑plan.

Workflow de doublage de base (démarrage rapide)

Une fois infsh installé et connecté, vous pouvez doubler un fichier vidéo ou audio dans une autre langue avec une seule commande.

Exemple : Doubler une vidéo anglaise en espagnol

infsh app run elevenlabs/dubbing --input '{
  "audio": "https://video.mp4",
  "target_lang": "es"
}'
``

Fonctionnement :

- `elevenlabs/dubbing` est l’app de doublage hébergée, appelée via le CLI.
- `audio` est l’URL de votre média source (audio ou vidéo). Il peut s’agir d’un lien `https://` vers un fichier comme `video.mp4`.
- `target_lang` est le code de langue pour la sortie doublée (ici `es` pour l’espagnol).

L’app traite le média source, traduit la parole et génère un doublage dans la langue cible tout en conservant la voix des intervenants.

### Langues prises en charge

La skill prend en charge 29 langues via des codes simples (exemples tirés du tableau en amont) :

- `en` – English
- `es` – Spanish
- `fr` – French
- `de` – German
- `it` – Italian
- `pt` – Portuguese
- `pl` – Polish
- `hi` – Hindi
- `ar` – Arabic
- `ko` – Korean
- `ru` – Russian
- `tr` – Turkish
- `nl` – Dutch
- `sv` – Swedish
- `da` – Danish
- `fi` – Finnish
- `no` – Norwegian
- `cs` – Czech

Consultez le tableau complet des langues dans le fichier `SKILL.md` en amont si vous avez besoin de la liste exhaustive des codes pris en charge.

### Cas d’usage typiques

#### 1. Localiser des vidéos YouTube ou des cours en ligne

1. Hébergez votre vidéo source sur un emplacement accessible en HTTPS (par exemple, bucket de stockage ou URL non répertoriée).
2. Lancez `infsh app run elevenlabs/dubbing` avec l’URL de la vidéo et le `target_lang` souhaité.
3. Téléchargez l’audio doublé, puis alignez ou remplacez la piste audio dans votre logiciel de montage (Premiere Pro, Final Cut, DaVinci Resolve, etc.).

#### 2. Traduire des podcasts et interviews

1. Hébergez le fichier audio d’origine (`.mp3`, `.wav` ou vidéo avec audio) sur une URL publique ou autorisée.
2. Appelez elevenlabs-dubbing avec cette URL et un code de langue cible.
3. Publiez la version localisée comme flux ou épisode séparé.

#### 3. Script et automatisation

Comme elevenlabs-dubbing est piloté via le CLI, vous pouvez :

- Envelopper la commande `infsh app run` dans des scripts shell
- Intégrer le doublage dans des pipelines CI/CD de publication de contenus
- Chaîner cette étape avec d’autres outils (par exemple transcription, découpage, scripts de mise en forme) dans un flux d’automatisation plus large

### Où regarder dans le dépôt

Si vous installez la skill dans un environnement d’agent, consultez ces fichiers pour plus de détails :

- `SKILL.md` – Description principale, fonctionnalités et démarrage rapide
- Répertoire `tools/audio/elevenlabs-dubbing` – Emplacement de cette skill dans le dépôt de skills partagé

Servez‑vous de ces fichiers comme références de mise en œuvre plutôt que de les copier à l’identique ; adaptez les exemples à votre propre infrastructure, stockage et contraintes de sécurité.

## FAQ

### Dans quels cas elevenlabs-dubbing est-il particulièrement adapté ?

elevenlabs-dubbing est très pertinent lorsque vous disposez déjà de contenus vidéo ou audio finalisés (ou quasi finalisés) et que vous souhaitez obtenir rapidement des versions multilingues de haute qualité, sans ré‑enregistrement :

- Transformer une vidéo à succès en anglais en versions espagnole, française ou allemande
- Localiser des webinars, tutoriels ou contenus e‑learning
- Étendre la portée de podcasts ou d’interviews à de nouveaux marchés linguistiques

La solution est idéale si vous privilégiez la rapidité, la montée en charge et la conservation de la voix des intervenants par rapport à un doublage studio sur‑mesure.

### Dans quels cas elevenlabs-dubbing n’est-il pas la meilleure option ?

Envisagez d’autres approches si :

- Vous avez besoin d’une réinterprétation créative complète (nouveaux scripts, timing comique, nouveau casting de voix)
- Votre workflow doit fonctionner entièrement hors ligne (sans appels au cloud)
- Vous exigez une interface graphique point‑and‑click intégrée directement à votre NLE

Dans ces cas, un studio de doublage traditionnel ou une solution vocale on‑premise sera sans doute plus approprié.

### Comment installer elevenlabs-dubbing ?

Il y a deux niveaux :

1. **Installer le CLI inference.sh** en suivant les instructions :  
   `https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md`
2. **(Optionnel) Ajouter la skill à votre environnement d’agent** avec :

   ```bash
   npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-dubbing

Le doublage proprement dit est exécuté via le CLI infsh en appelant l’app elevenlabs/dubbing.

Quels formats d’entrée puis-je utiliser ?

L’exemple dans le fichier SKILL en amont montre une URL vidéo (https://video.mp4) passée dans le champ audio. Cela implique que :

Vous pouvez envoyer des fichiers vidéo contenant une piste audio (par exemple .mp4 avec son)
L’extraction audio et le doublage sont gérés automatiquement par l’app

Pour de meilleurs résultats, fournissez une source propre, bien enregistrée, avec une parole claire et peu de bruit de fond.

Comment choisir la langue de doublage ?

Utilisez le champ target_lang dans l’entrée JSON pour indiquer la langue souhaitée :

infsh app run elevenlabs/dubbing --input '{
  "audio": "https://video.mp4",
  "target_lang": "fr"
}'

Remplacez fr par n’importe quel autre code de langue pris en charge, comme es, de, pt ou d’autres de la liste supportée.

elevenlabs-dubbing conserve-t-il la voix originale du locuteur ?

Oui. D’après la description de la skill, elevenlabs-dubbing est conçu pour la traduction avec conservation de la voix, en maintenant l’identité vocale des locuteurs tout en changeant de langue. C’est idéal pour les créateurs qui souhaitent que le public ait toujours l’impression d’entendre la même personne, simplement dans une autre langue.

Quel est le lien entre elevenlabs-dubbing et les outils de montage vidéo ?

elevenlabs-dubbing ne remplace pas votre logiciel de montage vidéo. Il s’intègre plutôt comme une étape de doublage spécialisée dans votre workflow :

Utilisez votre logiciel de montage pour finaliser la vidéo master.
Exportez ce fichier master ou hébergez‑le.
Lancez elevenlabs-dubbing via infsh pour générer l’audio localisé.
Réimportez ou reliez la piste doublée dans votre logiciel de montage pour finaliser chaque version linguistique.

Cette séparation vous permet de conserver votre stack de montage existante tout en ajoutant un doublage multilingue puissant comme étape automatisée.

Où trouver plus de détails techniques ?

Ouvrez le code source de la skill dans le dépôt :

URL GitHub : https://github.com/inferen-sh/skills/tree/main/tools/audio/elevenlabs-dubbing
Définition de la skill et démarrage rapide : SKILL.md

Utilisez ces fichiers pour comprendre la configuration exacte et les exemples fournis par les mainteneurs.

Notes et avis

Aucune note pour le moment

Partagez votre avis

Connectez-vous pour laisser une note et un commentaire sur cet outil.

0/10000

Derniers avis

Enregistrement...

Autres outils de cette catégorie

ai-marketing-videos

by inferen-sh

Création de vidéos marketing générées par IA via le CLI inference.sh. Utilisez ai-marketing-videos pour générer des vidéos promo, des démos produit, des vidéos explicatives et des créations publicitaires pour Facebook, YouTube, Instagram et TikTok en exploitant des modèles comme Veo, Seedance, Wan, FLUX et la voix off Kokoro.

Video Editing

Favorites 0GitHub 0

ai-avatar-video

by inferen-sh

Générez des vidéos d’avatar IA et de « talking head » à partir d’une image et d’une piste audio avec la CLI inference.sh. ai-avatar-video encapsule les apps OmniHuman, Fabric et PixVerse Lipsync pour créer des avatars pilotés par l’audio, des vidéos lipsync et des présentateurs virtuels, idéal pour les workflows marketing, d’explication et de contenu social.

Video Editing

Favorites 0GitHub 0

ai-video-generation

by inferen-sh

Générez des vidéos IA avec Google Veo, Seedance, Wan, Grok et plus de 40 modèles via la CLI inference.sh. Prend en charge le text-to-video, image-to-video, lipsync, animation d’avatar, upscaling vidéo et bruitages (foley) pour des formats social media, contenus marketing, vidéos explicatives et démos produit.

Video Editing

Favorites 0GitHub 0

ai-social-media-content

by inferen-sh

Générateur de contenus social media propulsé par l’IA pour TikTok, Instagram, YouTube et X. Utilisez le CLI inference.sh pour créer des vidéos, reels, shorts, miniatures, images, légendes et hashtags prêts pour chaque plateforme avec des modèles comme FLUX, Veo, Seedance, Wan, Kokoro TTS et Claude.

Social Media

Favorites 0GitHub 0

ai-content-pipeline

by inferen-sh

Concevez et exécutez des pipelines de contenu IA multi-étapes qui enchaînent des outils d’image, de vidéo, d’audio et de texte via le CLI inference.sh. Utilisez ai-content-pipeline pour automatiser des workflows comme : générer une image, l’animer en vidéo, ajouter un sound design ou une voix off, et préparer le contenu pour YouTube, les réseaux sociaux et vos campagnes marketing.

Workflow Automation

Favorites 0GitHub 0

elevenlabs-sound-effects

by inferen-sh

Générez des effets sonores IA à partir de prompts textuels en utilisant ElevenLabs via la CLI inference.sh. Idéal pour les monteurs vidéo, développeurs de jeux, podcasteurs, réalisateurs et créateurs de contenu qui ont besoin de sound design rapide et libre de droits. Prend en charge la génération text-to-sound-effect, la durée ajustable et le contrôle du prompt pour des SFX cinématographiques, ambiants et prêts pour le jeu.

Audio Editing

Favorites 0GitHub 0

agent-tools

by inferen-sh

agent-tools expose le CLI inference.sh au sein de votre agent pour exécuter plus de 150 apps d’IA depuis un seul endroit : génération d’images, création vidéo, LLMs, recherche, 3D et automatisation Twitter. Idéal si vous avez besoin d’un orchestrateur de workflows unifié pour FLUX, Veo, Gemini, Grok, Claude, Seedance, OmniHuman, Tavily, Exa, OpenRouter et plus encore, sans gérer de GPU ni d’intégrations complexes.

Workflow Automation

Favorites 0GitHub 0

remotion-best-practices

by remotion-dev

Bonnes pratiques Remotion concrètes pour créer des vidéos programmatiques, des animations et des compositions pilotées par l’audio avec React.

Video Editing

Favorites 0GitHub 2,4 k