transcribe

作者 openai

transcribe 可將音訊或影片轉成文字，並支援選用的聲紋分群與已知說話者提示。它特別適合技術寫作、會議紀錄、訪談、講座與內容營運；當你需要可重複使用、輸出格式清楚、且比通用提示詞更少猜測的 transcribe 技能時，這是一個相當合適的選擇。

Stars18.8k

評論0

加入時間2026年5月11日

分類技术写作

安裝指令

npx skills add openai/skills --skill transcribe

編輯評分

這個技能得分 74/100，對目錄使用者來說是可信的安裝候選：它有明確的轉錄用途、內建 CLI，以及足夠的操作指引，可比通用提示詞更少猜測。不過它仍屬於較聚焦的方案，因為倉庫證據顯示它偏向單一的音訊轉錄工作流程，而不是文件完整的端到端套件。

74/100

亮點

在 SKILL.md 中明確可觸發音訊/影片轉錄、說話者標註，以及訪談/會議等使用情境。
內建腳本與快速參考文件清楚說明主要操作限制：回應格式、分段策略、檔案大小上限，以及已知說話者限制。
操作流程具體：先檢查 API key，再執行 CLI、驗證輸出，最後將結果存到標準輸出路徑。

注意事項

這個技能的範圍較窄，集中在單一轉錄流程；若需要更廣泛的媒體處理行為，可能不適合。
從目前可見證據來看，安裝流程還不算完全自助：SKILL.md 有提到依賴項，但節錄內容沒有顯示完整安裝指令或完整快速上手範例。

语音转文字 Transcription 音频视频 OpenAI Cli Python

總覽

transcribe 技能總覽

transcribe 技能能做什麼

transcribe 技能會使用 OpenAI，將音訊或影片轉成文字，並可選擇啟用說話者分離，以及提供已知說話者提示。當你需要從錄音、訪談、會議、課堂或短影片中取得穩定可靠的 transcribe 結果，尤其是需要標示說話者時，這個技能很適合。

誰適合使用它

如果你想要的是可重複的工作流程，而不是一次性的提示詞，這個 transcribe 技能就很適合。它特別適用於 Technical Writing、會議紀錄、內容營運、研究訪談，以及任何需要乾淨文字和可追蹤說話者結構的人。

這個技能有什麼不同

它的主要優勢在於作業上的清楚明確：它偏好使用打包好的 CLI，對模型與輸出格式有明確的判斷規則，並且在需要時支援帶說話者分離的輸出。這讓 transcribe 比起一般「請幫我轉錄」的提示詞，更容易穩定執行，特別是當你在意可重現性與輸出格式時。

如何使用 transcribe 技能

安裝 transcribe 技能

使用 npx skills add openai/skills --skill transcribe 安裝。如果你是直接使用這個 repository，請從 skills/.curated/transcribe 開始，並維持內建工作流程不變，除非你的環境真的需要調整。

為 transcribe 使用準備正確的輸入

要讓 transcribe 發揮最佳效果，請提供：

音訊或影片檔案路徑
需要的回應格式：text、json 或 diarized_json
可選的語言提示
如果需要說話者分離，請提供已知說話者參考

一個好的提示詞像是：「請轉錄這段 18 分鐘的訪談，回傳 diarized_json，如果可以，請標示主持人和兩位來賓。」這比只說「請幫我轉錄」更好，因為它清楚告訴技能要優化的輸出結構和說話者脈絡。

先閱讀這些檔案

先看 SKILL.md，再查看 references/api.md，了解格式限制與說話者分離規則。如果你要擴充或自動化這個流程，請檢查 scripts/transcribe_diarize.py 和 agents/openai.yaml，確認預設模型、CLI 行為，以及提示詞入口點。

實用工作流程建議

純文字快速轉錄時，使用 gpt-4o-mini-transcribe；當說話者標籤很重要時，改用 gpt-4o-transcribe-diarize。超過約 30 秒的音訊，請維持 chunking_strategy 為 auto。執行前請先確認本機已設定 OPENAI_API_KEY；這個技能預期使用的是已配置好的環境，而不是直接貼上密鑰。

transcribe 技能 FAQ

transcribe 適合 Technical Writing 嗎？

適合。當你需要把來源音訊轉成可編輯的文字，用於文件、訪談或內容整理時，transcribe 技能對 Technical Writing 很有幫助。它重點不是創意改寫，而是把口語轉成可靠、結構清楚的文字。

什麼情況下不該用 transcribe？

如果你只需要粗略摘要、不需要逐字稿，就不適合用 transcribe。若你的檔案過大，超出支援的請求限制而又不先切分，也不適合。若你想要的是大量意譯，而不是忠實的語音轉文字，這也不是好選擇。

這和一般提示詞有什麼不同？

一般提示詞也能要求轉錄，但這個 transcribe 技能多了可重複的工作流程、偏好的 CLI、明確的回應格式選項，以及說話者分離指引。當你要在多個檔案之間維持一致輸出時，這會大幅減少猜測成本。

transcribe 對初學者友善嗎？

是的，只要你能辨識檔案與想要的輸出格式就行。初學者通常只需要在純文字與帶說話者分離的輸出之間做選擇。最大的門檻通常是環境設定，所以請先確認 OPENAI_API_KEY。

如何改進 transcribe 技能

提供更好的來源脈絡給 transcribe

通常品質提升最大的來源，不是更多提示詞，而是更好的輸入。例如，請說明音訊是 podcast、電話錄音還是課堂；是否有重疊發言；以及你要的是逐字稿還是整理過的 transcript 輸出。這能幫助 transcribe 選擇更合適的處理路徑。

當說話者分離重要時，使用說話者提示

如果你知道說話者姓名，請把它們當作參考資訊提供，而不是期待模型只靠音訊就能全部推斷出來。當某些人的聲音很像，或錄音裡有多位來賓時，這一點對 transcribe 尤其重要。已知說話者能提升標籤一致性，但前提是參考資訊要正確。

一次只改一個變數反覆調整

如果第一次的 transcribe 結果不理想，就只改一個變數：模型、分段方式、回應格式，或說話者提示。不要一次把整個請求重寫。舉例來說，如果標籤錯了，就先維持轉錄目標不變，只加入說話者參考，或改成 diarized JSON。

留意常見失敗模式

最常見的問題包括：API key 未設定、檔案處理不支援、輸出需求太模糊，以及在沒有可用說話者脈絡的情況下要求說話者分離。如果你要替工作流程建立 transcribe 指南，請把預期支援的檔案類型、偏好的輸出格式，以及錄音太雜訊或太長時的備用方案都寫清楚。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

seo-hreflang

作者 AgriciDaniel

seo-hreflang 可協助驗證並產生多語系與多區域網站的 hreflang 標記。可用來檢查 self-reference、return tags、x-default，以及跨 HTML、HTTP headers 和 XML sitemaps 的有效語言與地區代碼。非常適合需要可靠 seo-hreflang 指南支援的 SEO 內容團隊。

SEO 内容

收藏 0GitHub 0

openai-docs

作者 openai

將 openai-docs 用於技術寫作、OpenAI API 與產品問題、模型選擇、遷移檢查，以及提示詞升級指引。它會優先透過 Developer Docs MCP server 查詢官方 OpenAI 文件；只有在需要時，才把隨附參考資料當作備援上下文使用。

技术写作

收藏 0GitHub 0

seo

作者 affaan-m

seo 技能可協助稽核、規劃並落實技術型 SEO、頁面內優化、結構化資料、Core Web Vitals 與關鍵字對應。適用於可爬取性、可索引性、metadata、schema、內部連結、sitemap 與 robots 變更，或是針對 Keyword Research 的 SEO，並提供可直接套用到單一頁面的具體建議。

关键词研究

收藏 0GitHub 156.3k

adr-skill

作者 vercel

adr-skill 可協助團隊建立與維護可供代理執行的 Architecture Decision Records。它支援起草 ADR、初始化 ADR 資料夾、挑選範本、更新狀態，並透過檢查清單、腳本與範例驗證決策內容。

技术写作

收藏 0GitHub 23.1k

building-incident-response-playbook

作者 mukul975

building-incident-response-playbook 可協助資安團隊建立可重複使用的事件應變 playbook，內容涵蓋逐步階段、決策樹、升級標準、RACI 權責分工，以及可直接對接 SOAR 的架構。它適合用來撰寫事件應變程序文件、事件分流流程，以及便於稽核的營運應變計畫。

事件分诊

收藏 0GitHub 6.1k

prd-development

作者 deanpeters

prd-development 技能可協助你把蒐集到的筆記整理成一份結構化 PRD，涵蓋問題定義、使用者、解決方案、範疇與成功準則。適合用於工程交接、新功能規劃，以及 Technical Writing 的 prd-development。

技术写作

收藏 0GitHub 4.1k

user-story

作者 deanpeters

user-story 技能可協助你把產品需求轉成一則可直接交付開發的故事，並使用 Mike Cohn 寫法與 Gherkin 驗收條件。適合用在更清楚的交接、更好的估算，以及為技術寫作與產品團隊建立更精準的 user-story 指南。

技术写作

收藏 0GitHub 4.1k

treatment-plans

作者 K-Dense-AI

treatment-plans 技能可協助產生精簡、以臨床人員為中心的醫療治療計畫，並以可直接用於 LaTeX/PDF 的格式輸出。它支援一般內科、復健、心理健康、慢性病、術前術後照護與疼痛管理，內容包含 SMART 目標、實證導向介入、精簡引用，以及兼顧合規性的排版。很適合用於 Technical Writing 的 treatment-plans 與結構化照護文件撰寫。

技术写作

收藏 0GitHub 0

research-grants

作者 K-Dense-AI

research-grants 研究補助技能可將一個粗略的研究構想整理成可送審的補助計畫書，適用於 NSF、NIH、DOE、DARPA 或台灣 NSTC。它支援贊助機構適配度判讀、符合規範的架構、預算說明、審查標準對應，以及供計畫主持人、博士後與技術寫作者使用的章節草擬。

技术写作

收藏 0GitHub 0

provider-docs

作者 hashicorp

provider-docs 技能可協助你為 Terraform provider 建立、更新與驗證 Terraform Registry 文件。適用於 provider-docs 指南工作、Technical Writing 的 provider-docs，以及在文件變更時同步 schema descriptions、`tfplugindocs` templates 與 Registry 輸出。

技术写作

收藏 0GitHub 0

api-design

作者 affaan-m

api-design 是一個專注於 REST API 設計的 skill，適合用來規劃與審查 endpoints、資源命名、狀態碼、分頁、篩選、版本控管與錯誤回應。

API 开发

收藏 0GitHub 156.1k

press-release

作者 deanpeters

press-release 技能可協助你在開發前撰寫 Amazon 風格的 Working Backwards press release。它能幫你釐清顧客價值、驗證產品或功能構想，並用精簡、以客戶為中心的敘事對齊利害關係人。適合用於 Technical Writing 的 press-release，以及早期產品規劃。

技术写作

收藏 0GitHub 4.1k

asc-whats-new-writer

作者 rudrankriyam

asc-whats-new-writer 可將 git logs、條列重點或自由文字，轉成在地化的 App Store Connect「最新消息」文案，並使用 `./metadata` 中的標準中繼資料，以及可選的促銷文字更新。它適合需要可重複使用的 asc-whats-new-writer 指南、並希望減少猜測的發行經理、App 行銷人員與 SEO 內容團隊。

SEO 内容

收藏 0GitHub 790

source-driven-development

作者 addyosmani

source-driven-development 技能以官方文件為基礎來支撐特定框架的程式開發，協助你在實作前先驗證模式是否正確。當你在 React、Vue、Next.js、Svelte、Angular 以及類似技術棧中進行 source-driven-development，且正確性、來源依據與版本敏感的決策都很重要時，這項技能特別適合使用。

程式碼生成

收藏 0GitHub 18.8k

readme-i18n

作者 xixu-me

readme-i18n 可將 GitHub 風格的 README 轉成易於維護的多語版本，同時保留 Markdown、連結、程式碼區塊、檔名規則，以及各 README 之間共用的語言選擇器。

翻译

收藏 0GitHub 6

clinical-reports

作者 K-Dense-AI

clinical-reports 是一套結構化寫作技能，適用於臨床個案報告、診斷報告、臨床試驗報告與病人文件。它支援 CARE、ICH-E3、HIPAA、FDA 與 ICH-GCP 工作流程，並提供清楚的範本與指引，協助產出準確、去識別化、可直接用於出版的臨床寫作內容。

报告写作

收藏 0GitHub 0