speech

作者 openai

使用 speech 技能將文字轉成可播放的語音音訊，適用於旁白、配音、IVR 提示、無障礙朗讀與批次語音生成。它使用 OpenAI Audio API，內建 voices、隨附 CLI，並以 `OPENAI_API_KEY` 進行即時執行。自訂 voice 建立不在支援範圍內。

Stars0

評論0

加入時間2026年5月8日

分類設計实现

安裝指令

npx skills add openai/skills --skill speech

編輯評分

這個 skill 的評分為 88/100，代表它是相當紮實的目錄項目，對 agent 來說有不錯的實用價值。使用者可以期待一條明確可觸發的語音生成流程，比一般提示更具可執行性，且具備足夠的 CLI 與參考細節，足以支援實際安裝；但即時輸出仍依賴網路連線與 OpenAI API。

88/100

亮點

觸發性強：frontmatter 明確界定了文字轉語音旁白、配音、無障礙朗讀與批次語音生成等使用情境。
操作脈絡清楚：SKILL.md 提供單筆與批次處理的決策流程，以及逐步工作流程，並搭配隨附的 CLI 參考。
對 agent 很有幫助：支援文件涵蓋 voices、Audio API 參數、無障礙預設值與批次用法，能減少執行時的猜測成本。

注意事項

即時生成需要 `OPENAI_API_KEY` 與網路連線，因此無法完全離線獨立使用。
自訂 voice 建立不在範圍內；若需要客製 voices 或更進階的音訊工作流程，需尋找其他方案。

音频 Accessibility Anthropic OpenAI Cli

總覽

語音技能概覽

語音技能的用途

語音技能會把文字轉成可聆聽的音訊，適合旁白、配音、IVR 提示、無障礙朗讀，以及批次語音生成。當你需要的是可重現、可控的輸出，而不是「幫我把它念得好聽一點」這種自由發揮式需求時，它最合適。

誰適合使用

如果你的語音技能安裝是為了真正嵌入工作流程而來，就很適合：像是產品示範、App onboarding、無障礙素材，或是把結構化文字批次轉成很多段短音檔。當你在意聲線選擇、語速、輸出格式，以及多次執行都能維持一致時，它是很好的選擇。

這個技能有何不同

語音指南是以 OpenAI Audio API 和內建 CLI 為核心，因此偏向可預期、可重現的使用方式，而不是臨時丟一句提示詞來試效果。它使用內建聲音，支援單檔或批次工作，且在實際生成時需要 OPENAI_API_KEY。自訂聲音建立不在其範圍內。

如何使用語音技能

安裝並找到工作流程

使用 npx skills add openai/skills --skill speech 安裝。安裝後，先讀 SKILL.md，再看 references/cli.md 了解指令細節、references/audio-api.md 了解模型與參數限制，並參考 references/prompting.md 或 references/voice-directions.md 學習更好的指令寫法。若要快速掌握上下文，可再查看 agents/openai.yaml 和 references/sample-prompts.md。

把粗略目標轉成可用提示詞

語音技能的使用模式，最適合你把要朗讀的精確文字、目標聲線、表達風格、輸出格式，以及任何發音限制都說清楚。像這樣的需求就很強： “Generate a 45-second product demo voiceover from this script, use cedar, keep it warm and steady, output mp3, and emphasize the product name on first mention.” 這比「讓它聽起來專業一點」更有效，因為它給了技能具體的合成控制條件。

單檔與批次工作流程

這個技能設計成兩條路：單一音檔或多個音檔。如果你有多行文字、提示或檔案，就應該視為批次處理，先在 tmp/ 下準備暫時用的 JSONL 檔，然後一次執行 CLI，完成後刪除該 JSONL。如果只有一段腳本，就走單檔流程。這個判斷很重要，因為技能的結構與驗證步驟會隨輸出量而改變。

執行前要確認什麼

為了得到最佳結果，請確認文字是逐字正確，而不只是主題方向。也要確認聲線、檔案格式、語速，以及輸出是否必須偏中性、偏表情豐富，還是以無障礙優先。實際執行時主要要檢查的 repository 檔案是 scripts/text_to_speech.py；除非 repository 維護者明確指示，否則不要修改它。

語音技能常見問題

語音技能只適合旁白嗎？

不是。語音技能也適合配音、無障礙朗讀、IVR 提示，以及短音訊提示。它比較不適合自訂聲音複製或創意聲線設計，因為這個 repo 並未涵蓋這些內容。

使用語音技能一定要 CLI 嗎？

若要穩定使用語音技能，是的。內建 CLI 是預期的實際生成路徑，而 --dry-run 則適合在不呼叫 API 的情況下檢查指令形狀。如果你只寫一段通用提示詞，就會失去讓這個技能可重現的結構。

這對初學者友善嗎？

是的，只要你能提供精確文字和基本的聲線方向。語音安裝本身不複雜，但輸出品質取決於你把語速、語氣、格式和發音說得多清楚。初學者通常從短音檔和單一聲線開始，成功率會更高。

什麼情況下不該用這個技能？

如果你需要自訂聲音建立、重度後製，或是工作流程必須修改內建腳本，就不要用語音技能。如果你無法使用連網的 OpenAI API 呼叫，或沒有 OPENAI_API_KEY，它也不適合你。

如何改進語音技能

降低模糊空間

語音技能輸出品質提升最大的關鍵，就是把猜測空間降到最低。請提供精確文字，不要只給摘要；說明預期聽眾；並明確指出這段朗讀應該像旁白、客服訊息、無障礙朗讀，還是 IVR 提示。如果某個詞不好唸，就直接拼出唸法，或補上發音註記。

一次只調一個變數

當第一次結果已經接近，但還不夠理想時，只改一個項目：聲線、語速，或指令寫法。這樣比整段重寫提示詞更適合迭代。舉例來說，如果節奏太趕，就保持文字和聲線不變，只把速度從 1.0 調到 0.95。

使用真正重要的輸出限制

語音指南在限制條件是具體、可執行時表現最好，而不是抽象形容詞。可以明確寫成「mp3 方便快速播放」、「wav 供審閱」、或「穩定、中性，適合無障礙」。如果是批次工作，請讓每一行的範圍盡量單一，這樣技能才能在多個輸出之間維持一致的表達。

先讀對的參考文件

如果你想在 Design Implementation 情境下讓語音技能效果更好，優先看 references/accessibility.md 了解中性朗讀、references/voiceover.md 了解簡報式表達，以及 references/sample-prompts.md 了解提示詞格式。這些檔案能幫你寫出 CLI 和 API 可以直接執行、而不需要額外猜測的指令。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

frontend-design

作者 anthropics

frontend-design 協助你把模糊的 UI 構想變成具有明確美感方向的獨特、可上線前端介面，產出真實可用的 frontend 程式碼，減少千篇一律的 AI 風格。

UI 設計

收藏 1GitHub 105.2k

hyperframes

作者 heygen-com

hyperframes 是一個工作流程技能，用於在 HyperFrames 中建立以 HTML 為基礎的影片組成內容。當你需要結構化、以程式碼為核心的 hyperframes 來處理影片剪輯時，可用於標題卡、疊加圖層、字幕、旁白、音訊反應動態，以及場景轉場。它更重視版面配置、時間安排與動畫決策，而不是泛用的、只靠提示詞的影片需求。

视频编辑

收藏 0GitHub 2.7k

figma-generate-library

作者 figma

figma-generate-library 可協助你從程式碼庫建立或更新 Figma 設計系統，並以有順序的工作流程處理 tokens、元件庫、文件與明暗主題切換。當你需要的是 Design Systems 的實作指南，而不是一次性的 mockup 時，就適合使用 figma-generate-library 技能。它也會與 figma-use 互補，用於 Plugin API 呼叫。

設計系统

收藏 0GitHub 0

winui-app

作者 openai

winui-app 技能可協助你以 C# 與 Windows App SDK 啟動、建置與排查 WinUI 3 桌面應用程式。適合用於環境準備、新專案設定、Shell 與導覽選擇、XAML 控制項、主題樣式、無障礙設計、部署，以及啟動修復流程，特別適合 Frontend 開發。

前端开发

收藏 0GitHub 0

gsap-plugins

作者 greensock

gsap-plugins 可協助前端開發者正確選擇、安裝與使用 GSAP 插件。內容涵蓋插件註冊、匯入方式，以及 ScrollToPlugin、ScrollSmoother、Flip、Draggable、Inertia、Observer、SplitText、ScrambleText、SVG plugins、easing tools 和 GSDevTools 的實務指引。當你需要的是清楚的 gsap-plugins 指南，而不是泛用的動畫建議時，就很適合使用它。

前端开发

收藏 0GitHub 3.2k

ckm:design-system

作者 nextlevelbuilder

ckm:design-system 從清晰的 token 架構出發，協助建立三層 tokens、元件規格、CSS variables、Tailwind 對應，以及維持品牌一致的簡報投影片資產。

設計系统

收藏 0GitHub 53.6k

impeccable

作者 pbakaus

impeccable 可協助你打造有辨識度、可直接投入產品的前端 UI，而不是一眼就看出是 AI 生成的制式介面。它支援 craft、teach 與 extract 工作流程，可用於頁面、web components、app 介面、海報與其他設計比重高的前端場景，因此特別適合 UI Design、設計情境建立，以及可重用設計模式的萃取。

UI 設計

收藏 0GitHub 20.4k

figma

作者 openai

使用 figma 從 Figma MCP 伺服器擷取設計脈絡、截圖、變數與素材，並把 Figma 節點轉成可直接實作的 UI 決策。當你手上有 Figma URL 或 node ID，並且需要用正確的 figma 用法來處理設計轉程式碼、安裝設定或疑難排解時，這個 figma skill 特別適合。

設計实现

收藏 0GitHub 18.6k

archimate

作者 markdown-viewer

archimate 可讓你在 PlantUML 中使用 `!include <archimate/Archimate>`、型別化元素巨集與關係巨集來建立 ArchiMate 圖表。它適合分層的企業架構視圖，涵蓋業務、應用、技術、動機與遷移規劃。當你需要結構化的 EA 標記法，而不是一般雲端或網路圖時，請使用 archimate 進行圖表繪製。

Diagramming

收藏 0GitHub 1.1k

tvos-design-guidelines

作者 ehmo

tvos-design-guidelines 是一套實用的 Apple TV 設計規範，用於檢視 tvOS 介面、以焦點為核心的導覽、Siri Remote 行為、10 呎可讀性，以及媒體播放。當你需要清楚的限制條件、逐畫面檢視，和針對客廳 UI 設計的實作檢查時，可使用這份 tvos-design-guidelines 指南。

UI 設計

收藏 0GitHub 357

android-design-guidelines

作者 ehmo

android-design-guidelines 是一份實用指南，涵蓋 Material Design 3、Jetpack Compose 與 XML 版面配置。可用來檢視 Android UI 決策，包括主題、導覽、無障礙、響應式版面、動態色彩，以及 Material You 相容性。很適合用於 android-design-guidelines guide 與 android-design-guidelines for UI Design 相關任務。

UI 設計

收藏 0GitHub 357

figma-use

作者 openai

figma-use 是在 Figma Plugin API 工作流程中安全呼叫 `use_figma` 的必要技能。在使用 JavaScript 撰寫、更新、檢查或結構化 Figma 檔案之前，先安裝並載入 figma-use 技能。它特別適合設計實作、元件作業、變數、auto layout，以及程式化讀取檔案。

設計实现

收藏 0GitHub 0

shadcn

作者 shadcn-ui

使用 shadcn 技能檢查專案脈絡、執行正確的 CLI 指令、安裝元件，並依照文件化模式組合 UI，涵蓋 base 與 radix 的差異、forms、theming 與 registries。

UI 設計

收藏 0GitHub 111k

visionos-design-guidelines

作者 ehmo

visionos-design-guidelines 技能可協助你套用 Apple Vision Pro 在空間式 UI、眼神與手勢輸入、沉浸式空間、視窗、Volume 與無障礙設計上的規範。當你在檢視或設計需要舒適度、正確擺放，以及符合平台慣例的 visionOS 介面時，這項技能特別適合使用。

UI 設計

收藏 0GitHub 357

swiftui-patterns

作者 affaan-m

swiftui-patterns 是一份適用於 Apple 平台前端開發的實用指南。它涵蓋 SwiftUI 狀態管理、NavigationStack 流程、view 組合與效能建議，協助你在真實的 app 程式碼中選對模式。當你要重構或建立需要清楚權責分工、並盡量減少重繪的畫面時，適合使用 swiftui-patterns 技能。

前端开发

收藏 0GitHub 156.3k

design-review

作者 garrytan

design-review 是一個以 UX 為導向的設計 QA 技能，用來稽核線上介面，找出間距、層級、視覺一致性與互動問題，再透過驗證反覆修正。它支援在實作前先進行 plan-mode 檢視，適合你需要一份能對應具體原始碼變更的 design-review 指南，而不是空泛建議的情境。

UX 稽核

收藏 0GitHub 91.8k