Transcription

Transcription taxonomy generated by the site skill importer.

6 個技能

transcribe

作者 openai

transcribe 可將音訊或影片轉成文字，並支援選用的聲紋分群與已知說話者提示。它特別適合技術寫作、會議紀錄、訪談、講座與內容營運；當你需要可重複使用、輸出格式清楚、且比通用提示詞更少猜測的 transcribe 技能時，這是一個相當合適的選擇。

技术写作

收藏 0GitHub 18.8k

speech-to-text

作者 NoizAI

speech-to-text 技能可將支援的音訊檔轉寫為純文字，並提供時間戳記、說話者標籤與 JSON 輸出等選項。它專為需要可重複執行的實務 speech-to-text 工作流程而設計，包括訪談、會議、Podcast、講座，以及重視轉寫一致性的自動化任務。

工作流自動化

收藏 0GitHub 498

tts

作者 NoizAI

tts skill 可將文字轉成語音音訊，適用於旁白、配音、口白，以及與時間軸對齊的播放。你可以用它把純文字產生為語音檔、將文章或文字檔轉成語音，或依 SRT 產生具時間控制的音訊。它支援簡單模式與時間軸模式，並提供可感知後端的工作流程，方便重複且穩定地使用 tts。

語音生成

收藏 0GitHub 498

youtube-summarizer

作者 BrianRWagner

youtube-summarizer 可將 YouTube 連結轉換為結構化的逐字稿摘要，包含重點洞察、中繼資料，以及可選的章節級拆解。非常適合快速簡報、研究筆記，或把長篇影片改寫成可搜尋的重點內容。請參考 youtube-summarizer install、youtube-summarizer usage，以及 youtube-summarizer guide，了解 Summarization 工作流程。

摘要

收藏 0GitHub 276

transcribe-video

作者 rameerez

transcribe-video skill 會使用 AWS Transcribe 將影片或音訊檔轉成 .srt、.vtt 和 .txt 輸出。當你需要字幕、可搜尋的逐字稿，或乾淨的口語內容文字版時，很適合用來處理 transcribe-video；也適用於 Format Conversion 工作流程中的 transcribe-video 需求。

格式转换

收藏 0GitHub 23

markitdown

作者 K-Dense-AI

markitdown 可將檔案與 Office 文件轉換為 Markdown，讓內容更容易閱讀、切分、搜尋，也更適合 LLM 工作流程。這個 markitdown 技能支援 PDF、DOCX、PPTX、XLSX、HTML、CSV、JSON、XML、ZIP、EPUB、含 OCR 的圖片，以及音訊轉錄，是一份實用的 markitdown 格式轉換指南。

格式转换

收藏 0GitHub 0