音频编辑

瀏覽設計下與音频编辑相關的 Agent Skill，並比較相近工作流、工具與使用情境。

6 個技能

fal-ai-media

作者 affaan-m

fal-ai-media 是一個透過 fal.ai MCP 提供整合式媒體生成的 GitHub 技能。它協助使用者安裝並使用 fal-ai-media 技能，支援圖片生成、圖片編輯、影片、語音與音訊工作流程，並提供模型搜尋、成本檢查與引導式提示。

影像生成

收藏 0GitHub 156.1k

video-translation

作者 NoizAI

video-translation 技能可將影片中的口語內容翻譯成其他語言，生成 TTS 配音，並在保留影片內容不變的前提下替換或混合音訊。當你手上已有來源影片、字幕，以及要用來 Translation 的目標語言時，這個技能特別適合實際的影片翻譯使用情境。

翻译

收藏 0GitHub 498

tts

作者 NoizAI

tts skill 可將文字轉成語音音訊，適用於旁白、配音、口白，以及與時間軸對齊的播放。你可以用它把純文字產生為語音檔、將文章或文字檔轉成語音，或依 SRT 產生具時間控制的音訊。它支援簡單模式與時間軸模式，並提供可感知後端的工作流程，方便重複且穩定地使用 tts。

語音生成

收藏 0GitHub 498

sound-fx

作者 NoizAI

使用 sound-fx 技能把文字提示轉成音效、擬音、環境底音、怪物聲，以及 UI 音效。它很適合 Audio Editing 的 sound-fx、快速原型製作與可下載的音訊素材。先用 NoizAI/skills 安裝，再透過腳本式工作流程搭配有效的 Noiz API key 使用。**不適用於**語音、歌詞、旋律或聲音複製。

音频编辑

收藏 0GitHub 498

chat-with-anyone

作者 NoizAI

chat-with-anyone 可讓你從公開音訊複製真實人物的聲音，或根據圖片設計相符的聲音，接著用 TTS 生成合成回覆。它支援角色扮演、敘事與語音生成等實用工作流程，並提供安裝、來源選擇與安全使用的指引。

語音生成

收藏 0GitHub 498

speech

作者 openai

使用 speech 技能將文字轉成可播放的語音音訊，適用於旁白、配音、IVR 提示、無障礙朗讀與批次語音生成。它使用 OpenAI Audio API，內建 voices、隨附 CLI，並以 `OPENAI_API_KEY` 進行即時執行。自訂 voice 建立不在支援範圍內。

設計实现

收藏 0GitHub 0

音频编辑

瀏覽 設計 下與 音频编辑 相關的 Agent Skill，並比較相近工作流、工具與使用情境。

瀏覽設計下與音频编辑相關的 Agent Skill，並比較相近工作流、工具與使用情境。