baoyu-youtube-transcript

par JimLiu

baoyu-youtube-transcript permet d’extraire les transcriptions YouTube, les sous-titres et les images de couverture à partir d’une URL ou d’un ID de vidéo. Il prend en charge le choix de la langue, la traduction, la sortie en markdown ou en SRT, le reformatage avec cache, ainsi qu’un basculement de l’API InnerTube vers yt-dlp pour récupérer les transcriptions de façon plus fiable.

Étoiles13.2k

Favoris0

Commentaires0

Ajouté5 avr. 2026

CatégorieFormat Conversion

Commande d’installation

npx skills add JimLiu/baoyu-skills --skill baoyu-youtube-transcript

Score éditorial

Cette skill obtient une note de 84/100, ce qui en fait une fiche solide dans l’annuaire pour les utilisateurs qui recherchent une extraction fiable de transcriptions YouTube, avec moins d’incertitude qu’un prompt générique. Le dépôt présente un flux de travail réel et exécutable, avec des déclencheurs explicites, un usage CLI, un mécanisme de repli et des tests, ce qui permet vraisemblablement à un agent de l’invoquer correctement et de produire des transcriptions, des sous-titres ou des images de couverture avec un niveau de confiance raisonnable.

84/100

Points forts

Excellente capacité de déclenchement : la description mentionne des intentions utilisateur concrètes et des schémas d’entrée précis comme les URL YouTube, les demandes de transcription/sous-titres et les demandes d’image de couverture.
Bonne substance opérationnelle : `SKILL.md` documente l’usage et le dépôt inclut une CLI TypeScript/Bun fonctionnelle ainsi que 7 scripts de support pour récupérer, analyser, mettre en cache et formater les transcriptions.
Valeur réelle pour un agent : l’outil utilise directement YouTube InnerTube, bascule vers yt-dlp en cas de blocage, prend en charge le choix/traduction de la langue, les chapitres, un prompt de traitement des intervenants et la mise en cache pour le reformatage.

Points de vigilance

L’installation et la configuration d’exécution ne sont clarifiées qu’en partie : `SKILL.md` mentionne les prérequis Bun/npx et la résolution à l’exécution, mais il n’y a pas de commande d’installation simple dans le fichier de skill.
Certains comportements avancés demandent encore une interprétation de la part de l’agent, en particulier pour l’identification des intervenants et le traitement des chapitres, qui reposent sur un prompt plutôt que sur un workflow de bout en bout strictement imposé.

Video Audio Translation Markdown Cli Bun TypeScript

Vue d’ensemble

Vue d’ensemble de la skill baoyu-youtube-transcript

Ce que baoyu-youtube-transcript fait particulièrement bien

baoyu-youtube-transcript est une skill d’extraction de transcriptions YouTube pensée pour celles et ceux qui ont besoin de fichiers texte réellement exploitables, pas seulement de sous-titres affichés à l’écran. Elle télécharge les transcriptions, les sous-titres et les images de couverture à partir d’une URL YouTube ou d’un ID de vidéo, prend en charge la sélection de langue et la traduction, et peut reformater des données mises en cache en markdown ou en SRT sans relancer la récupération. Son principal avantage concret, c’est sa fiabilité : elle utilise d’abord l’API InnerTube de YouTube, puis bascule sur yt-dlp quand l’accès direct est bloqué.

Pour quels utilisateurs et pour quel besoin concret baoyu-youtube-transcript est le plus adapté

Cette skill convient particulièrement aux chercheurs, preneurs de notes, archivistes, équipes de réexploitation de contenus et agents chargés de faire de la conversion de format depuis une vidéo vers des ressources markdown, sous-titres ou transcription. Le vrai besoin couvre généralement ce cas : « prendre cette vidéo, récupérer la transcription dans la langue qu’il me faut, conserver les horodatages ou les chapitres si c’est utile, et enregistrer le tout dans une arborescence de fichiers réutilisable ensuite ».

Les différenciateurs clés de baoyu-youtube-transcript avant installation

Par rapport à un simple prompt du type « résume cette vidéo YouTube », baoyu-youtube-transcript fournit des sorties orientées fichiers, un système de cache, une sélection de pistes sensible à la langue et un chemin d’extraction plus déterministe. Le dépôt inclut aussi un prompt de traitement des intervenants dans prompts/speaker-transcript.md, ce qui compte si votre objectif final est une transcription éditoriale plus propre plutôt qu’un bloc brut de lignes de sous-titres.

Comment utiliser la skill baoyu-youtube-transcript

Contexte d’installation et prérequis d’exécution

Pour installer baoyu-youtube-transcript, vous devez disposer de bun ou de npx. Les scripts de la skill se trouvent dans skills/baoyu-youtube-transcript/scripts/, et SKILL.md précise explicitement que le runtime résolu est d’abord bun, puis npx -y bun. Si vous évaluez la skill avant adoption, commencez par lire ces fichiers :

SKILL.md
scripts/main.ts
scripts/youtube.ts
prompts/speaker-transcript.md
scripts/main.test.ts

Ce parcours vous permet de comprendre bien plus vite que par une exploration complète du repo le comportement réel du CLI, la logique de repli et le workflow de post-traitement.

Comment l’usage de baoyu-youtube-transcript fonctionne en pratique

Dans un usage normal de baoyu-youtube-transcript, vous appelez le script principal avec une URL YouTube ou un ID de vidéo de 11 caractères. Le script peut :

récupérer les pistes de transcription
privilégier de meilleurs formats de sous-titres comme json3
choisir entre sous-titres manuels et sous-titres générés automatiquement
traduire lorsque c’est disponible
produire une sortie en markdown ou en SRT
mettre en cache les métadonnées et les charges utiles de transcription dans un répertoire de sortie

L’élément d’entrée le plus important n’est pas un long prompt, mais une intention d’extraction précise. Les bonnes requêtes indiquent clairement :

l’URL ou l’ID de la vidéo
les langues souhaitées, par ordre de priorité
si les sous-titres générés sont acceptables
le format de sortie attendu : markdown ou SRT
si les horodatages, les chapitres ou les intervenants sont nécessaires

Une requête plus solide ressemble à ceci : « Use baoyu-youtube-transcript on this YouTube URL, prefer en then zh-Hans, allow generated captions, output markdown with timestamps, and save under a reusable output directory. »

Prompts et workflow baoyu-youtube-transcript pour réduire l’incertitude

Si vous invoquez cette skill via un agent IA, transformez un objectif vague en instruction directement exécutable. Par exemple :

Extraction : « Fetch the transcript for this video ID in en; if unavailable, use translated en from another track. »
Mise en forme : « Return markdown with timestamps for review. »
Enrichissement : « Then use prompts/speaker-transcript.md to convert the raw transcript into a chaptered, speaker-labeled transcript without translating. »

Ce workflow en deux temps est important, car l’identification des intervenants est une tâche de traitement distincte, différente du simple téléchargement des sous-titres bruts. Le fichier de prompt insiste sur la fidélité verbatim et la cohérence des noms d’intervenants, ce qui est particulièrement utile pour les interviews, les podcasts et les transcriptions de cours.

Structure de sortie, cache et conseils pratiques

La skill baoyu-youtube-transcript stocke les métadonnées et le cache de transcription, ce qui accélère les reformattages répétés. C’est particulièrement utile si vous voulez à la fois une sortie brute et une version retravaillée à partir de la même vidéo. Conseils pratiques :

Utilisez un outputDir stable si vous revenez souvent sur les mêmes vidéos.
Conservez la transcription brute avant d’appliquer un nettoyage des intervenants.
Choisissez le SRT quand la précision temporelle compte ; choisissez le markdown quand la lisibilité prime.
Si l’extraction des chapitres est importante, vérifiez si la description de la vidéo contient des chapitres horodatés, car les scripts analysent les chapitres à partir de la description et de la durée.

FAQ sur la skill baoyu-youtube-transcript

baoyu-youtube-transcript est-il meilleur qu’un prompt classique ?

Oui, dès lors que vous avez besoin d’une extraction reproductible plutôt que d’un raisonnement « best effort ». Un prompt classique ne peut pas télécharger de manière fiable les pistes de sous-titres, inspecter les langues disponibles, mettre en cache les ressources brutes, ni basculer sur yt-dlp. baoyu-youtube-transcript est plus pertinent quand votre tâche relève de l’acquisition et de la conversion, pas seulement du résumé.

Dans quels cas cette skill baoyu-youtube-transcript est-elle mal adaptée ?

Elle est mal adaptée s’il n’existe aucune piste de transcription accessible et que vous attendez une transcription speech-to-text complète à partir de l’audio seul. Ce repo est conçu autour de la récupération des transcriptions et sous-titres YouTube, pas comme une pipeline ASR autonome. C’est aussi excessif si vous voulez seulement un résumé rapide lisible par un humain et que vous n’avez pas besoin de fichiers enregistrés.

baoyu-youtube-transcript est-il adapté aux débutants ?

Dans une certaine mesure. La skill est pilotée par scripts plutôt que par clics, donc une familiarité minimale avec bun, npx, les chemins et les dossiers de sortie aide clairement. Le point positif, c’est que le repo est très orienté implémentation : scripts/main.test.ts montre la logique de sélection, et SKILL.md donne les modèles de commande nécessaires pour démarrer sans risque.

Comment améliorer l’usage de la skill baoyu-youtube-transcript

Fournir de meilleures entrées pour de meilleurs résultats avec baoyu-youtube-transcript

Le moyen le plus rapide d’améliorer les résultats de baoyu-youtube-transcript consiste à être explicite sur la sélection de transcription. Indiquez l’ordre de priorité des langues, précisez si les sous-titres manuels doivent être privilégiés, et si les sous-titres générés automatiquement sont acceptables. Sans cela, vous risquez d’obtenir une piste exploitable mais de moindre qualité, ou une variante traduite inattendue.

Gérer tôt les modes d’échec fréquents

Les problèmes les plus courants sont les identifiants de vidéo invalides, les récupérations directes bloquées, l’absence de sous-titres dans la langue cible et la confusion entre « traduire les sous-titres » et « résumer la transcription ». Si l’extraction échoue, examinez conceptuellement le comportement de scripts/youtube.ts : la skill dispose déjà d’un chemin de repli, donc l’étape suivante consiste le plus souvent à ajuster les contraintes de langue ou à autoriser les sous-titres générés, pas à réécrire entièrement le prompt.

Itérer après la première transcription avec baoyu-youtube-transcript

Pour baoyu-youtube-transcript dans un usage de conversion de format, le meilleur workflow est itératif :

récupérer la transcription brute
vérifier la langue et la complétude
relancer dans un autre format si nécessaire
appliquer un post-traitement des intervenants ou des chapitres

Si le premier markdown paraît désordonné, n’abandonnez pas la skill. Conservez plutôt les fichiers bruts mis en cache, puis relancez le formatage ou appliquez prompts/speaker-transcript.md pour obtenir un document final plus propre. C’est précisément à ce moment-là que cette skill devient plus utile qu’un simple script de téléchargement ponctuel.

Notes et avis

Aucune note pour le moment

Partagez votre avis

Connectez-vous pour laisser une note et un commentaire sur cet outil.

0/10000

Derniers avis

Enregistrement...

Autres outils de cette catégorie

kreuzberg

par kreuzberg-dev

La compétence kreuzberg vous aide à installer et utiliser Kreuzberg pour l’extraction de documents dans plus de 91 formats, dont les PDF, fichiers Office, images, HTML, e-mails et archives. Elle couvre les workflows Python, Node.js/TypeScript, Rust et CLI pour l’OCR, les tableaux, les métadonnées, le traitement par lots et des conseils pratiques d’analyse.

PDF Processing

Favoris 0GitHub 0

xlsx

par anthropics

Le skill xlsx aide les agents à lire, modifier, réparer, créer et convertir des fichiers .xlsx, .xlsm, .csv et .tsv quand le livrable attendu est un tableur. Il est particulièrement adapté aux mises à jour préservant les modèles, aux modifications de classeurs sans casser les formules, au nettoyage de tableaux désordonnés et aux workflows de tableur appuyés par des scripts du repo pour le packaging, la validation et le recalcul.

Spreadsheet Workflows

Favoris 0GitHub 105.1k

pdf

par anthropics

Le skill pdf accompagne les tâches de traitement de PDF : extraction de texte, fusion et scission, rendu de pages en images et workflows autour des formulaires PDF. Il est particulièrement utile pour vérifier les champs remplissables, extraire les métadonnées de formulaires et valider par script la mise en page de formulaires non remplissables.

PDF Processing

Favoris 0GitHub 105.1k

baoyu-url-to-markdown

par JimLiu

baoyu-url-to-markdown convertit des URL en direct en Markdown via le CLI embarqué baoyu-fetch, avec Chrome CDP, des adaptateurs par site et un mode de repli générique. Vérifiez les exigences d’exécution avec Bun, la configuration initiale de `EXTEND.md`, ainsi que l’usage pour X, YouTube, Hacker News et les pages rendues.

Format Conversion

Favoris 0GitHub 13.2k

pymatgen

par K-Dense-AI

pymatgen est une boîte à outils Python pour la science des matériaux, dédiée aux structures cristallines, aux diagrammes de phase, à la structure électronique et à la conversion de fichiers. Ce skill pymatgen aide à gérer des workflows scientifiques avec des données CIF, POSCAR, VASP et Materials Project.

Scientific

Favoris 0GitHub 0

minimax-xlsx

par MiniMax-AI

La skill minimax-xlsx aide à créer, lire, modifier, valider et mettre en forme des classeurs Excel avec un flux de travail centré sur Excel. Utilisez minimax-xlsx pour les workflows de feuilles de calcul lorsque vous avez besoin de fichiers structurés qui préservent les formules, les styles, la mise en page des feuilles et le comportement du classeur. Elle prend en charge les tâches .xlsx, .xlsm, .csv et .tsv, notamment l’analyse, la création de nouveaux classeurs, les modifications minimales, la réparation de formules et la validation. Le guide minimax-xlsx est conçu pour une remise de vrai classeur, pas pour de simples tableaux plats.

Spreadsheet Workflows

Favoris 0GitHub 0

baoyu-format-markdown

par JimLiu

baoyu-format-markdown met en forme du texte brut ou un Markdown désordonné en un Markdown plus propre et prêt à publier, tout en préservant le sens. Il corrige le frontmatter, les titres, les listes, les blocs de code, les citations et l’espacement CJK, ce qui en fait un bon choix pour la conversion de format sans réécrire le contenu.

Format Conversion

Favoris 0GitHub 13.2k

baoyu-danger-x-to-markdown

par JimLiu

baoyu-danger-x-to-markdown convertit des posts, fils et certains articles X en Markdown avec front matter YAML. Il s’appuie sur des scripts dans `scripts/` via `bun` ou `npx -y bun`, prend en charge l’accès par cookies et le flux de consentement, et convient mieux à des workflows reproductibles de conversion de format qu’à un prompt générique.

Format Conversion

Favoris 0GitHub 13.2k

baoyu-markdown-to-html

par JimLiu

baoyu-markdown-to-html convertit du Markdown en HTML mis en forme pour une publication de style WeChat. Il prend en charge les thèmes, la coloration du code, les formules mathématiques, PlantUML, les notes de bas de page, la gestion des images et, en option, les citations de liens, avec une exécution via bun ou `npx -y bun`.

Format Conversion

Favoris 0GitHub 13.2k

nutrient-document-processing

par affaan-m

Skill nutrient-document-processing pour le traitement de PDF et l’automatisation documentaire avec l’API Nutrient DWS. Convertissez, faites de l’OCR, extrayez, caviardez, signez, appliquez un filigrane et remplissez des fichiers comme des PDF, DOCX, XLSX, PPTX, HTML et des images.

PDF Processing

Favoris 0GitHub 156.2k

speech-to-text

par NoizAI

La skill speech-to-text transcrit les fichiers audio pris en charge en texte brut, avec des options pour les horodatages, les identifiants de locuteurs et la sortie JSON. Elle est conçue pour un usage pratique de la transcription speech-to-text dans des workflows reproductibles, notamment pour les interviews, réunions, podcasts, cours et tâches d’automatisation où la régularité de la transcription compte.

Workflow Automation

Favoris 0GitHub 498

transcribe-video

par rameerez

La skill transcribe-video transforme des fichiers vidéo ou audio en sorties .srt, .vtt et .txt avec AWS Transcribe. Utilisez-la pour les usages de transcribe-video quand vous avez besoin de sous-titres, d’une transcription consultable ou d’une version texte propre d’un contenu oral. Elle convient aussi aux workflows de conversion de format autour de transcribe-video.

Format Conversion

Favoris 0GitHub 23

markitdown

par K-Dense-AI

markitdown convertit des fichiers et des documents bureautiques en Markdown pour faciliter la lecture, le découpage en chunks, la recherche et les workflows LLM. Cette skill markitdown prend en charge les PDF, DOCX, PPTX, XLSX, HTML, CSV, JSON, XML, ZIP, EPUB, les images avec OCR et la transcription audio, ce qui en fait un guide markitdown pratique pour la conversion de formats.

Format Conversion

Favoris 0GitHub 0

pdf

par openai

Utilisez la skill pdf pour les tâches de traitement de PDF où la mise en page, la pagination et le rendu comptent. Elle vous aide à lire, créer, modifier et relire des PDF avec un flux de travail centré sur le visuel : rendez les pages, inspectez le résultat, puis ajustez. Servez-vous-en quand vous avez besoin d’une installation pdf fiable, d’une utilisation de pdf bien cadrée et d’un guide pdf pratique pour garantir la précision des documents.

PDF Processing

Favoris 0GitHub 0

web-to-markdown

par softaworks

web-to-markdown est un skill de conversion de format qui transforme des pages web en direct en Markdown propre via le CLI local `web2md`, en s’appuyant sur un navigateur de la famille Chromium pour les pages rendues en JS, les parcours interactifs et la conversion par lots d’URL. Il ne s’exécute que lorsqu’il est explicitement invoqué par son nom.

Format Conversion

Favoris 0GitHub 1.3k

defuddle

par kepano

defuddle extrait un markdown propre à partir de pages web avec la CLI Defuddle, en supprimant les éléments parasites pour la recherche, la documentation et les articles. À utiliser pour les pages HTML standard, avec installation via npm, en évitant les URL se terminant par `.md`.

Web Research

Favoris 0GitHub 19.7k