baoyu-youtube-transcript

von JimLiu

baoyu-youtube-transcript extrahiert YouTube-Transkripte, Untertitel und Cover-Bilder aus einer URL oder Video-ID. Unterstützt Sprachwahl, Übersetzung, Ausgabe als Markdown oder SRT, gecachte Neuformatierung sowie einen Fallback von der InnerTube API zu yt-dlp für eine zuverlässigere Transkript-Abrufung.

Stars13.2k

Favoriten0

Kommentare0

Hinzugefügt5. Apr. 2026

KategorieFormat Conversion

Installationsbefehl

npx skills add JimLiu/baoyu-skills --skill baoyu-youtube-transcript

Kurationswert

Dieses Skill erreicht 84/100 und ist damit ein starker Verzeichnis-Kandidat für Nutzer, die eine zuverlässige Extraktion von YouTube-Transkripten mit weniger Rätselraten als bei einem generischen Prompt suchen. Das Repository zeigt einen realen, ausführbaren Workflow mit klaren Triggern, CLI-Nutzung, Fallback-Verhalten und Tests, sodass ein Agent es voraussichtlich korrekt aufrufen und mit solider Zuverlässigkeit Transkripte, Untertitel oder Cover-Bilder erzeugen kann.

84/100

Stärken

Hohe Auslösbarkeit: Die Beschreibung nennt konkrete Nutzerabsichten und Eingabemuster wie YouTube-URLs, Anfragen nach Transkripten/Untertiteln und Requests für Cover-Bilder.
Gute operative Substanz: SKILL.md dokumentiert die Nutzung, und das Repo enthält eine funktionierende TypeScript/Bun-CLI sowie 7 unterstützende Skripte zum Abrufen, Parsen, Cachen und Formatieren von Transkripten.
Sinnvoller Hebel für Agenten: Das Skill nutzt YouTube InnerTube direkt, weicht bei Blockierung auf yt-dlp aus und unterstützt Sprachwahl/Übersetzung, Kapitel, einen Prompt zur Sprecherverarbeitung sowie Caching für Neuformatierungen.

Hinweise

Installation und Laufzeit-Setup sind nur teilweise klar: SKILL.md erwähnt Anforderungen an Bun/npx und die Laufzeitauflösung, aber in der Skill-Datei fehlt ein einfacher Installationsbefehl.
Einige fortgeschrittene Verhaltensweisen erfordern weiterhin Interpretation durch den Agenten, besonders bei Sprechererkennung und Kapitelverarbeitung, die eher durch einen Prompt angeleitet als durch einen strikt durchgängigen End-to-End-Workflow fest vorgegeben sind.

Video Audio Translation Markdown Cli Bun TypeScript

Überblick

Überblick über den baoyu-youtube-transcript Skill

Was baoyu-youtube-transcript besonders gut kann

baoyu-youtube-transcript ist ein Skill zur Extraktion von YouTube-Transkripten für alle, die verwertbare Textdateien brauchen – nicht nur Untertitel auf dem Bildschirm. Er lädt Transkripte, Untertitel und Cover-Bilder aus einer YouTube-URL oder einer Video-ID herunter, unterstützt Sprachwahl und Übersetzung und kann zwischengespeicherte Daten später in Markdown oder SRT umformatieren, ohne erneut abzurufen. Der größte praktische Vorteil ist die Zuverlässigkeit: Zuerst nutzt der Skill die InnerTube API von YouTube und greift bei blockiertem Direktzugriff auf yt-dlp als Fallback zurück.

Für wen baoyu-youtube-transcript am besten passt und welches konkrete Problem er löst

Dieser Skill eignet sich besonders für Researchers, Notizersteller, Archivare, Content-Repurposing-Workflows und Agents, die Format Conversion von Video in Markdown-, Untertitel- oder Transkript-Dateien umsetzen. Der eigentliche Job lautet meist: „Nimm dieses Video, hole das Transkript in der Sprache, die ich brauche, behalte bei Bedarf Zeitstempel oder Kapitel bei und speichere alles in einer Dateistruktur, die ich später wiederverwenden kann.“

Die wichtigsten Unterschiede vor der Installation

Im Vergleich zu einem generischen Prompt wie „Fasse dieses YouTube-Video zusammen“ liefert baoyu-youtube-transcript dateibasierte Ausgaben, Caching, sprachbewusste Track-Auswahl und einen deutlich deterministischeren Extraktionspfad. Das Repo enthält außerdem unter prompts/speaker-transcript.md einen Prompt für die Sprecheraufbereitung. Das ist relevant, wenn Sie am Ende kein rohes Untertitelmaterial, sondern ein sauber redigierbares Transkript brauchen.

So verwenden Sie den baoyu-youtube-transcript Skill

Installationskontext und Laufzeitvoraussetzungen

Für die Installation von baoyu-youtube-transcript benötigen Sie entweder bun oder npx. Die Skripte des Skills liegen in skills/baoyu-youtube-transcript/scripts/, und SKILL.md legt die Laufzeit explizit in der Reihenfolge bun zuerst, dann npx -y bun fest. Wenn Sie den Skill vor einer Übernahme evaluieren, sollten Sie zuerst diese Dateien lesen:

SKILL.md
scripts/main.ts
scripts/youtube.ts
prompts/speaker-transcript.md
scripts/main.test.ts

Über diesen Pfad verstehen Sie das tatsächliche CLI-Verhalten, die Fallback-Logik und den Post-Processing-Workflow schneller, als wenn Sie das gesamte Repo durchsehen.

Wie baoyu-youtube-transcript in der Praxis funktioniert

Bei der normalen Nutzung von baoyu-youtube-transcript rufen Sie das Hauptskript mit einer YouTube-URL oder einer 11-stelligen Video-ID auf. Das Skript kann:

Transkript-Tracks abrufen
bessere Untertitelformate wie json3 bevorzugen
manuelle gegenüber automatisch generierten Captions auswählen
übersetzen, wenn verfügbar
Markdown oder SRT ausgeben
Metadaten und Transkript-Payloads in einem Ausgabeverzeichnis cachen

Für die Qualität der Ergebnisse ist nicht ein langer Prompt entscheidend, sondern eine präzise Extraktionsabsicht. Gute Anfragen enthalten:

Video-URL oder ID
bevorzugte Sprachen in Reihenfolge
ob generierte Captions akzeptabel sind
gewünschtes Ausgabeformat: Markdown oder SRT
ob Zeitstempel, Kapitel oder Sprecher benötigt werden

Eine bessere Anfrage sieht zum Beispiel so aus: „Use baoyu-youtube-transcript on this YouTube URL, prefer en then zh-Hans, allow generated captions, output markdown with timestamps, and save under a reusable output directory.”

Prompting und Workflow, die unnötiges Rätselraten vermeiden

Wenn Sie den Skill über einen AI agent aufrufen, sollten Sie aus einem vagen Ziel eine ausführungstaugliche Anweisung machen. Zum Beispiel:

Extraction: “Fetch the transcript for this video ID in en; if unavailable, use translated en from another track.”
Formatting: “Return markdown with timestamps for review.”
Enhancement: “Then use prompts/speaker-transcript.md to convert the raw transcript into a chaptered, speaker-labeled transcript without translating.”

Dieser zweistufige Workflow ist wichtig, weil Sprecherkennzeichnung eine eigene Verarbeitungsaufgabe ist und nicht dasselbe wie der Download roher Untertitel. Die Prompt-Datei betont wortgetreue Wiedergabe und konsistente Sprechernamen – besonders nützlich für Interviews, Podcasts und Vorlesungstranskripte.

Ausgabestruktur, Caching und praktische Hinweise

Der baoyu-youtube-transcript Skill speichert Metadaten und Transkript-Cache, damit wiederholte Umformatierungen schneller gehen. Das ist besonders wertvoll, wenn Sie aus demselben Video sowohl rohe als auch aufbereitete Ausgaben erzeugen möchten. Praktische Hinweise:

Verwenden Sie ein stabiles outputDir, wenn Sie Videos häufiger erneut aufrufen.
Behalten Sie die rohe Transkript-Ausgabe, bevor Sie eine Sprecherbereinigung anwenden.
Nutzen Sie SRT, wenn exakte Zeitsteuerung wichtig ist; verwenden Sie Markdown, wenn Lesbarkeit im Vordergrund steht.
Wenn Kapitel wichtig sind, prüfen Sie, ob die Videobeschreibung Kapitel mit Zeitstempeln enthält, da die Skripte Kapitel aus Beschreibung und Dauer parsen.

FAQ zum baoyu-youtube-transcript Skill

Ist baoyu-youtube-transcript besser als ein normaler Prompt?

Ja – wenn Sie reproduzierbare Extraktion statt Best-Effort-Reasoning brauchen. Ein normaler Prompt kann Untertitelspuren nicht zuverlässig herunterladen, verfügbare Sprachen nicht sicher prüfen, rohe Assets nicht cachen und auch nicht auf yt-dlp zurückfallen. baoyu-youtube-transcript ist klar stärker, wenn es um Beschaffung und Konvertierung geht und nicht nur um Zusammenfassungen.

Wann ist dieser Skill keine gute Wahl?

Er passt schlecht, wenn kein zugänglicher Transkript-Track vorhanden ist und Sie eine vollständige Speech-to-Text-Transkription allein aus dem Audio erwarten. Dieses Repo ist auf das Abrufen von YouTube-Transkripten und Untertiteln ausgelegt, nicht auf eine eigenständige ASR-Pipeline. Ebenfalls überdimensioniert ist es, wenn Sie nur eine schnelle menschliche Zusammenfassung möchten und keine gespeicherten Dateien brauchen.

Ist baoyu-youtube-transcript anfängerfreundlich?

Eingeschränkt. Der Skill ist skriptgetrieben statt klickbasiert, daher hilft ein grundlegender Umgang mit bun, npx, Pfaden und Ausgabeordnern. Die gute Nachricht: Das Repo ist stark implementierungsnah. scripts/main.test.ts zeigt die Auswahl-Logik, und SKILL.md liefert die nötigen Befehlsmuster, um sicher zu starten.

So verbessern Sie den baoyu-youtube-transcript Skill

Mit besseren Eingaben zu besseren baoyu-youtube-transcript Ergebnissen

Der schnellste Weg zu besseren Ergebnissen mit baoyu-youtube-transcript ist eine explizite Vorgabe für die Transkript-Auswahl. Nennen Sie die Sprachpriorität, ob manuelle Untertitel bevorzugt werden sollen und ob automatisch generierte Captions akzeptabel sind. Wenn Sie das weglassen, erhalten Sie unter Umständen zwar einen brauchbaren, aber qualitativ schwächeren Track oder eine unerwartete Übersetzungsvariante.

Typische Fehlerbilder früh abfangen

Häufige Probleme sind ungültige Video-IDs, blockierte Direktabrufe, fehlende Captions in der Zielsprache und Verwechslungen zwischen „Untertitel übersetzen“ und „Transkript zusammenfassen“. Wenn die Extraktion fehlschlägt, betrachten Sie das Verhalten von scripts/youtube.ts konzeptionell: Der Skill hat bereits einen Fallback-Pfad. Der nächste sinnvolle Schritt ist daher meist, Sprachvorgaben anzupassen oder generierte Captions zuzulassen – nicht, den gesamten Prompt neu zu schreiben.

Nach dem ersten Transkript iterativ weiterarbeiten

Für baoyu-youtube-transcript bei Format Conversion ist ein iterativer Workflow am sinnvollsten:

rohes Transkript abrufen
Sprache und Vollständigkeit prüfen
bei Bedarf in einem anderen Format erneut ausführen
Sprecher-/Kapitel-Post-Processing anwenden

Wenn das erste Markdown unübersichtlich aussieht, sollten Sie den Skill nicht vorschnell verwerfen. Behalten Sie stattdessen die gecachten Rohdateien und führen Sie die Formatierung erneut aus oder nutzen Sie prompts/speaker-transcript.md für ein saubereres Enddokument. Genau an diesem Punkt wird der Skill wertvoller als ein einmaliges Download-Skript.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

kreuzberg

von kreuzberg-dev

Die kreuzberg-Skill hilft dir, Kreuzberg zu installieren und für die Dokumentextraktion aus über 91 Formaten zu nutzen – darunter PDFs, Office-Dateien, Bilder, HTML, E-Mails und Archive. Abgedeckt werden Python-, Node.js-/TypeScript-, Rust- und CLI-Workflows für OCR, Tabellen, Metadaten, Stapelverarbeitung und praxisnahe Hinweise zum Parsen.

PDF Processing

Favoriten 0GitHub 0

xlsx

von anthropics

Der xlsx-Skill hilft Agents beim Lesen, Bearbeiten, Reparieren, Erstellen und Konvertieren von .xlsx-, .xlsm-, .csv- und .tsv-Dateien, wenn das gewünschte Ergebnis eine Tabellenkalkulationsdatei ist. Besonders stark ist er bei vorlagentreuen Updates, formulasicheren Workbook-Änderungen, der Bereinigung unübersichtlicher Tabellendaten und praxisnahen Spreadsheet-Workflows mit Repo-Skripten für Packaging, Validierung und Neuberechnung.

Spreadsheet Workflows

Favoriten 0GitHub 105.1k

pdf

von anthropics

Der pdf Skill unterstützt bei Aufgaben der PDF-Verarbeitung wie Textextraktion, Zusammenführen und Teilen, dem Rendern von Seiten als Bilder sowie Formular-Workflows. Besonders nützlich ist er zum Prüfen ausfüllbarer Felder, zum Extrahieren von Formularmetadaten und zur skriptgestützten Validierung nicht ausfüllbarer Formularlayouts.

PDF Processing

Favoriten 0GitHub 105.1k

baoyu-url-to-markdown

von JimLiu

baoyu-url-to-markdown wandelt Live-URLs mit einer eingebundenen baoyu-fetch-CLI per Chrome CDP, Site-Adaptern und generischem Fallback in Markdown um. Prüfen Sie die Bun-Laufzeitvoraussetzungen, die einmalige Einrichtung von EXTEND.md und die Nutzung für X, YouTube, Hacker News sowie gerenderte Seiten.

Format Conversion

Favoriten 0GitHub 13.2k

pymatgen

von K-Dense-AI

pymatgen ist ein Python-Toolkit für Materialwissenschaften für Kristallstrukturen, Phasendiagramme, elektronische Struktur und Dateikonvertierung. Diese pymatgen-Skill hilft bei wissenschaftlichen Workflows mit CIF, POSCAR, VASP und Daten aus dem Materials Project.

Scientific

Favoriten 0GitHub 0

minimax-xlsx

von MiniMax-AI

Das minimax-xlsx-Skill unterstützt das Erstellen, Lesen, Bearbeiten, Validieren und Formatieren von Excel-Arbeitsmappen mit einem Excel-zentrierten Workflow. Verwenden Sie minimax-xlsx für Spreadsheet-Workflows, wenn Sie strukturierte Dateien benötigen, die Formeln, Formatierungen, Blattlayout und das Verhalten der Arbeitsmappe erhalten. Es unterstützt Aufgaben mit .xlsx, .xlsm, .csv und .tsv, einschließlich Analyse, Erstellen neuer Arbeitsmappen, minimalinvasiver Änderungen, Reparatur von Formeln und Validierung. Der minimax-xlsx-Leitfaden ist für die Übergabe echter Arbeitsmappen konzipiert, nicht für einfache Flachtabellen.

Spreadsheet Workflows

Favoriten 0GitHub 0

baoyu-format-markdown

von JimLiu

baoyu-format-markdown formatiert Klartext oder unübersichtliches Markdown zu sauberem, veröffentlichungsreifem Markdown und bewahrt dabei die Bedeutung. Es korrigiert Frontmatter, Überschriften, Listen, Codeblöcke, Zitate und CJK-Abstände und eignet sich damit gut für Format Conversion, ohne Inhalte neu zu schreiben.

Format Conversion

Favoriten 0GitHub 13.2k

baoyu-danger-x-to-markdown

von JimLiu

baoyu-danger-x-to-markdown wandelt X-Posts, Threads und einige Artikel in Markdown mit YAML-Frontmatter um. Es nutzt Skripte in `scripts/` mit `bun` oder `npx -y bun`, unterstützt Cookie-basierten Zugriff und Consent-Abläufe und eignet sich für wiederholbare Format-Conversion-Workflows besser als ein allgemeiner Prompt.

Format Conversion

Favoriten 0GitHub 13.2k

baoyu-markdown-to-html

von JimLiu

baoyu-markdown-to-html wandelt Markdown in gestaltetes HTML für WeChat-ähnliche Veröffentlichungen um. Unterstützt werden Themes, Code-Highlighting, Mathematik, PlantUML, Fußnoten, Bildverarbeitung und optionale Link-Zitate; die Ausführung erfolgt zur Laufzeit über bun oder `npx -y bun`.

Format Conversion

Favoriten 0GitHub 13.2k

nutrient-document-processing

von affaan-m

nutrient-document-processing Skill für PDF-Verarbeitung und Dokumentenautomatisierung mit der Nutrient DWS API. Konvertieren, OCRen, extrahieren, schwärzen, signieren, mit Wasserzeichen versehen und Dateien wie PDFs, DOCX, XLSX, PPTX, HTML und Bilder ausfüllen.

PDF Processing

Favoriten 0GitHub 156.2k

speech-to-text

von NoizAI

Die speech-to-text-Skill transkribiert unterstützte Audiodateien in Klartext und bietet Optionen für Zeitstempel, Sprecherlabels und JSON-Ausgabe. Sie ist auf den praktischen Einsatz von speech-to-text in wiederholbaren Workflows ausgelegt, darunter Interviews, Meetings, Podcasts, Vorlesungen und Automatisierungsaufgaben, bei denen konsistente Transkriptionen wichtig sind.

Workflow Automation

Favoriten 0GitHub 498

transcribe-video

von rameerez

Die transcribe-video-Skill wandelt Video- oder Audiodateien mit AWS Transcribe in .srt-, .vtt- und .txt-Ausgaben um. Verwenden Sie sie, wenn Sie transcribe-video für Untertitel, ein durchsuchbares Transkript oder eine saubere Textfassung gesprochener Inhalte brauchen. Sie eignet sich auch für transcribe-video in Format-Conversion-Workflows.

Format Conversion

Favoriten 0GitHub 23

markitdown

von K-Dense-AI

markitdown konvertiert Dateien und Office-Dokumente in Markdown, damit Inhalte leichter lesbar, in Chunks aufteilbar und durchsuchbar sind und sich besser in LLM-Workflows nutzen lassen. Diese markitdown-Skill unterstützt PDF, DOCX, PPTX, XLSX, HTML, CSV, JSON, XML, ZIP, EPUB, Bilder mit OCR und Audio-Transkription und ist damit ein praktischer markitdown-Leitfaden für die Formatkonvertierung.

Format Conversion

Favoriten 0GitHub 0

pdf

von openai

Nutzen Sie die pdf skill für PDF-Verarbeitungsaufgaben, bei denen Layout, Seitenaufteilung und gerenderte Ausgabe wichtig sind. Sie hilft dabei, PDFs in einem visuell orientierten Workflow zu lesen, zu erstellen, zu bearbeiten und zu prüfen: Seiten rendern, das Ergebnis ansehen und dann gezielt anpassen. Verwenden Sie sie, wenn Sie eine verlässliche PDF-Installation, eine praktische pdf-Nutzung und einen brauchbaren pdf-Leitfaden für dokumentgenaue Arbeit brauchen.

PDF Processing

Favoriten 0GitHub 0

web-to-markdown

von softaworks

web-to-markdown ist ein Skill für Formatkonvertierung, der Live-Webseiten über das lokale `web2md`-CLI in sauberes Markdown umwandelt. Für JS-gerenderte Seiten, interaktive Abläufe und die Batch-Konvertierung von URLs nutzt er einen Browser der Chromium-Familie. Er wird nur ausgeführt, wenn er ausdrücklich namentlich aufgerufen wird.

Format Conversion

Favoriten 0GitHub 1.3k

defuddle

von kepano

defuddle extrahiert mit der Defuddle CLI sauberes Markdown aus Webseiten und entfernt dabei störenden Ballast für Recherche, Dokumentation und Artikel. Geeignet für normale HTML-Seiten, installierbar mit npm; URLs mit der Endung .md solltest du überspringen.

Web Research

Favoriten 0GitHub 19.7k