video-translation

par NoizAI

La skill video-translation traduit le contenu parlé d’une vidéo dans une autre langue, génère un doublage TTS et remplace ou mixe l’audio tout en conservant la vidéo intacte. Elle convient surtout à un usage concret de traduction vidéo lorsque vous disposez d’une vidéo source, de sous-titres et d’une langue cible pour la traduction.

Étoiles498

Favoris0

Commentaires0

Ajouté14 mai 2026

CatégorieTranslation

Commande d’installation

npx skills add NoizAI/skills --skill video-translation

Score éditorial

Cette skill obtient 74/100, ce qui la rend digne d’intégrer la liste, à condition d’être présentée avec des réserves claires. Les utilisateurs du répertoire y trouvent un vrai flux de travail, non factice, pour traduire et doubler des vidéos, avec des déclencheurs explicites et des scripts d’appui, mais il faut s’attendre à un peu d’intégration, car le dépôt ne détaille pas complètement un parcours d’installation et d’exécution de bout en bout.

74/100

Points forts

Des phrases déclencheuses et des cas d’usage explicites permettent à un agent de savoir facilement quand utiliser la skill.
Le fichier SKILL.md propose un flux de travail concret pour télécharger les sous-titres, les traduire phrase par phrase et remplacer la piste audio.
Les scripts d’appui pour le remplacement audio et le ducking SRT montrent une vraie intention opérationnelle, au-delà d’un simple prompt générique.

Points de vigilance

Le flux de travail dépend d’une autre skill (`youtube-downloader`) et d’outils externes comme ffmpeg, donc l’installation et l’exécution peuvent demander une configuration supplémentaire.
Il n’existe pas de commande d’installation et le flux de travail extrait est partiellement tronqué, ce qui réduit la clarté immédiate pour les utilisateurs du répertoire.

Video Ffmpeg Tts Captions Youtube Script

Vue d’ensemble

Aperçu du skill de traduction vidéo

Ce que fait la traduction vidéo

Le skill video-translation traduit le contenu parlé d’une vidéo dans une autre langue, génère une bande-son doublée avec TTS, puis remplace l’audio d’origine tout en conservant la vidéo intacte. Il convient surtout aux personnes qui ont une vidéo précise, une langue cible définie et l’objectif de rendre l’audio réellement regardable/écoutable, plutôt que de se contenter d’un texte traduit à l’écran.

À qui s’adresse ce skill

Le skill de traduction vidéo convient aux personnes qui localisent des contenus façon YouTube, des clips de formation interne, des vidéos explicatives ou tout autre format court à moyen, dès lors que le minutage des sous-titres est disponible ou peut être استخراجé. Il est moins utile si vous avez seulement besoin de sous-titres, si l’audio source est trop bruité pour permettre un bon alignement, ou si vous cherchez une synchronisation labiale de niveau humain plutôt qu’une version doublée pratique.

Ce qu’il faut vérifier avant l’installation

Le point décisif, c’est l’adéquation au workflow : video-translation suppose que vous puissiez récupérer la vidéo source ainsi que les sous-titres, traduire le texte des sous-titres avec soin, produire l’audio TTS, puis remuxer le résultat dans la vidéo. Si votre chaîne inclut déjà le téléchargement vidéo, la gestion des sous-titres et l’édition basée sur ffmpeg, le skill est un bon choix ; sinon, prévoyez une configuration supplémentaire autour de ces dépendances.

Comment utiliser le skill de traduction vidéo

Installer et inspecter le skill

Utilisez video-translation install dans la chaîne d’outils du répertoire, ou installez-le depuis le chemin du repo avec npx skills add NoizAI/skills --skill video-translation. Après l’installation, lisez d’abord SKILL.md, puis consultez scripts/replace_audio.sh et scripts/srt_to_duck.py pour comprendre concrètement comment fonctionnent le remplacement audio et le ducking piloté par les sous-titres.

Transformer une demande vague en prompt exploitable

Pour un meilleur usage de video-translation, fournissez l’URL ou le chemin du fichier vidéo, la langue source, la langue cible, et précisez si vous voulez un remplacement complet de la voix ou un audio mixé. Un mauvais prompt serait « translate this video » ; un meilleur serait : « Translate this Spanish YouTube video to English, generate natural-sounding English TTS, and replace the original audio while preserving subtitle timing and silence gaps. »

Workflow pratique conforme au repo

La logique du repo est la suivante : télécharger la vidéo et les sous-titres, traduire le SRT phrase par phrase, générer l’audio doublé, puis remplacer ou mixer l’audio avec ffmpeg. Si des sous-titres existent, le script d’aide peut réduire le volume de l’audio original pendant les segments parlés, ce qui sonne généralement mieux qu’une coupure nette. Si les sous-titres manquent ou sont mal alignés, attendez-vous à une qualité moindre, car la couche de timing fait partie de la valeur.

Ce qu’il faut vérifier en premier dans le repo

Commencez par SKILL.md pour comprendre l’intention du trigger, l’ordre du workflow et la forme du prompt de traduction. Ouvrez ensuite scripts/replace_audio.sh pour voir les flags requis comme --video, --audio, --output et l’option --srt, puis examinez scripts/srt_to_duck.py si vous devez comprendre comment les timestamps des sous-titres sont convertis en commandes de ducking. Ces deux scripts renseignent bien mieux sur l’usage réel que la description générale seule.

FAQ du skill de traduction vidéo

Le skill de traduction vidéo n’est-il qu’un modèle de prompt ?

Non. Le skill video-translation est une configuration orientée workflow, pas seulement une aide à la formulation. Il repose sur l’extraction des sous-titres, une traduction avec un format SRT stable, la génération TTS et le remplacement audio ; il est donc plus opérationnel qu’un simple prompt générique du type « translate this video ».

Quand le skill de traduction vidéo est-il un bon choix ?

Utilisez video-translation lorsque l’objectif est une lecture doublée dans une autre langue et que la vidéo source peut être traitée localement ou via vos outils existants. Il est particulièrement utile pour les vidéos pédagogiques, les interviews et les contenus narrés, où préserver la piste visuelle compte davantage qu’une imitation parfaite de la voix.

Quelles sont les principales limites ?

Les plus grandes limites sont la qualité des sous-titres, la qualité audio et l’alignement temporel. Si la transcription source est incorrecte, le doublage traduit héritera de ces erreurs ; si la voix TTS sonne artificielle, le résultat restera perçu comme doublé ; et si la vidéo comporte des interlocuteurs qui se superposent, le mix fondé sur le ducking peut manquer de netteté.

Les débutants ont-ils besoin d’outils supplémentaires ?

Oui, le plus souvent. video-translation suppose une certaine aisance avec les fichiers, les sous-titres et les outils vidéo en ligne de commande. Si vous débutez, le skill peut quand même aider, mais il faudra probablement relire les scripts d’aide et vérifier les étapes ffmpeg, sous-titres et TTS avant de faire confiance au premier rendu.

Comment améliorer le skill de traduction vidéo

Donnez de meilleures entrées, pas seulement plus d’entrées

Le guide video-translation le plus solide commence par des langues source et cible clairement indiquées, le fichier vidéo exact ou son URL, et le public visé. Précisez si vous voulez un registre soutenu ou conversationnel, si les noms propres et termes techniques doivent rester non traduits, et si le rendu final doit conserver des pauses pour un timing naturel.

Réduisez les modes d’échec les plus courants

La plupart des mauvais résultats viennent de sous-titres défectueux, de noms propres non traités, ou d’un TTS qui ignore la ponctuation et les frontières de phrases. Pour améliorer video-translation for Translation, vérifiez le SRT avant le doublage, conservez inchangés l’index et le format des timestamps, et découpez les longues lignes de sous-titres en unités de parole naturelles avant de générer l’audio.

Itérez après le premier rendu

Considérez le premier passage comme un test de timing, pas comme la livraison finale. Si le doublage paraît précipité, allongez les pauses dans le texte source ou ajustez la segmentation des phrases ; si le mix est trop agressif, revenez sur le comportement de ducking piloté par le SRT ; si le texte semble trop littéral, réécrivez le prompt de traduction des sous-titres pour exiger une sortie orale et idiomatique.

Utilisez les scripts pour affiner la qualité

Les scripts d’aide du repo montrent ce qui compte vraiment : le timing, le remplacement et la stabilité des transitions audio. Si vous améliorez le skill video-translation pour un usage répété, construisez une petite checklist autour de la précision des sous-titres, du choix de la voix TTS et de la vérification finale du remux afin d’éviter que les mêmes erreurs ne reviennent à chaque vidéo.

Notes et avis

Aucune note pour le moment

Partagez votre avis

Connectez-vous pour laisser une note et un commentaire sur cet outil.

0/10000

Derniers avis

Enregistrement...

Autres outils de cette catégorie

baoyu-translate

par JimLiu

baoyu-translate est un workflow de traduction pour les articles longs et les documents Markdown, avec des modes rapide, standard et soigné, la prise en charge de glossaires, et le découpage via bun ou npx pour des résultats cohérents.

Translation

Favoris 0GitHub 13.2k

readme-i18n

par xixu-me

readme-i18n aide à traduire un README de type GitHub en versions multilingues faciles à maintenir, tout en préservant le Markdown, les liens, les blocs de code, les conventions de nommage des fichiers et un sélecteur de langue partagé entre les fichiers README.

Translation

Favoris 0GitHub 6

localization

par Eronred

Utilisez la compétence de localisation pour planifier la localisation de l’App Store sur les marchés internationaux. Elle aide les équipes à décider quels pays cibler, s’il faut localiser la fiche App Store ou l’application elle-même, et comment éviter un travail de traduction à faible valeur ajoutée. Idéale pour les équipes Product Marketing, ASO, les fondateurs et les responsables growth qui ont besoin d’un guide pratique de localisation avec priorisation des marchés et vérifications de préparation.

Product Marketing

Favoris 0GitHub 0

visa-doc-translate

par affaan-m

visa-doc-translate traduit en anglais les images de documents de demande de visa et génère un PDF bilingue avec la page originale et sa traduction. L’outil est conçu pour les dossiers de visa structurés, avec repli OCR, gestion de la rotation et préservation des noms, dates et montants.

Translation

Favoris 0GitHub 156.3k

translate-book

par deusyu

translate-book est une skill de traduction de livres pour les fichiers PDF, DOCX et EPUB. Elle convertit l’entrée en chunks Markdown, traduit avec des sous-agents parallèles, vérifie l’intégrité des chunks, puis reconstruit des sorties HTML, DOCX, EPUB et PDF. Utilisez-la pour des workflows de traduction reproductibles sur des contenus longs avec translate-book.

Translation

Favoris 0GitHub 681

azure-ai-translation-text-py

par microsoft

azure-ai-translation-text-py aide les équipes backend à utiliser le SDK Azure AI Text Translation pour Python afin de traduire, translittérer, détecter la langue et rechercher des termes de dictionnaire. Il inclut des conseils d’installation, d’authentification et d’utilisation pour intégrer l’application en production avec des identifiants Azure et la configuration du point de terminaison.

Backend Development

Favoris 0GitHub 0

frontend-design

par anthropics

frontend-design transforme des idées d’interface floues en UIs distinctives, prêtes pour la prod, avec du vrai code frontend, une direction esthétique claire et moins de style IA générique.

UI Design

Favoris 1GitHub 105.2k

create-colleague

par titanwings

create-colleague transforme des documents de collègues, chats, e-mails, captures d’écran, ainsi que des données Feishu et DingTalk, en un skill IA modifiable avec des sorties séparées pour le travail et le persona, ainsi que des flux de mise à jour pour l’améliorer dans la durée.

Skill Authoring

Favoris 1GitHub 747

hyperframes

par heygen-com

hyperframes est un skill de workflow pour créer des compositions vidéo en HTML dans HyperFrames. Utilisez-le pour les cartes de titre, les superpositions, les sous-titres, les voix off, les mouvements réactifs à l'audio et les transitions de scène lorsque vous avez besoin de hyperframes structurés, pensés d'abord en code, pour le montage vidéo. Il privilégie les choix de mise en page, de timing et d'animation plutôt que de simples requêtes vidéo génériques basées sur du prompt.

Video Editing

Favoris 0GitHub 2.7k

kreuzberg

par kreuzberg-dev

La compétence kreuzberg vous aide à installer et utiliser Kreuzberg pour l’extraction de documents dans plus de 91 formats, dont les PDF, fichiers Office, images, HTML, e-mails et archives. Elle couvre les workflows Python, Node.js/TypeScript, Rust et CLI pour l’OCR, les tableaux, les métadonnées, le traitement par lots et des conseils pratiques d’analyse.

PDF Processing

Favoris 0GitHub 0

skill-creator

par anthropics

skill-creator est une méta-skill de création de skills pour rédiger de nouvelles skills, réviser des fichiers SKILL.md, lancer des évaluations, comparer des variantes et améliorer les descriptions de déclenchement avec les scripts du dépôt et des outils de revue.

Skill Authoring

Favoris 2GitHub 105.1k

azure-identity-py

par microsoft

azure-identity-py aide à configurer l’authentification Azure en Python avec Microsoft Entra ID. Utilisez-le pour choisir entre `DefaultAzureCredential`, l’identité managée ou l’authentification par principal de service, configurer les variables d’environnement et résoudre les problèmes de contrôle d’accès et de chaîne d’identifiants. Les conseils d’installation, les schémas d’utilisation et les notes de configuration pratiques s’appuient sur le fichier de skill du dépôt.

Access Control

Favoris 0GitHub 2.2k

claude-api

par anthropics

claude-api est une skill pratique pour installer et utiliser l’API Claude et les SDK Anthropic. Elle aide à choisir le bon SDK ou l’option HTTP brute, à repérer la documentation adaptée à chaque langage et à implémenter le streaming, l’usage d’outils, les fichiers, les batchs et la gestion des erreurs avec moins d’incertitude.

API Development

Favoris 0GitHub 105k

wrangler

par cloudflare

Le skill wrangler vous aide à trouver les bonnes commandes CLI, les bons schémas de configuration et les étapes de déploiement pour Cloudflare Workers. Utilisez-le pour l’usage de wrangler, les vérifications d’installation de wrangler et un guide pratique de wrangler lors de la création ou de la mise en ligne de Workers pour le développement backend.

Backend Development

Favoris 0GitHub 1.3k

clickhouse-best-practices

par ClickHouse

clickhouse-best-practices est un skill de bonnes pratiques ClickHouse pour l’ingénierie des bases de données. Il guide la conception du schéma, l’optimisation des requêtes, la stratégie d’insertion et la connexion des agents avec des recommandations fondées sur des règles, afin de faciliter le déclenchement, la revue et la citation de l’usage de clickhouse-best-practices dans les workflows ClickHouse.

Database Engineering

Favoris 0GitHub 412

clickhouse-architecture-advisor

par ClickHouse

clickhouse-architecture-advisor aide à concevoir des workloads ClickHouse avec des décisions adaptées à la charge pour l’ingestion, le partitionnement, les jointures, les dictionnaires, les upserts et la pré-agrégation. Il est particulièrement utile pour le Backend Development, l’observabilité, le SIEM, l’analytics produit, la télémétrie IoT et les pipelines financiers. Le skill qualifie les recommandations comme official, derived ou field.

Backend Development

Favoris 0GitHub 412