音频编辑

瀏覽 設計 下與 音频编辑 相關的 Agent Skill,並比較相近工作流、工具與使用情境。

6 個技能
A
fal-ai-media

作者 affaan-m

fal-ai-media 是一個透過 fal.ai MCP 提供整合式媒體生成的 GitHub 技能。它協助使用者安裝並使用 fal-ai-media 技能,支援圖片生成、圖片編輯、影片、語音與音訊工作流程,並提供模型搜尋、成本檢查與引導式提示。

影像生成
收藏 0GitHub 156.1k
N
video-translation

作者 NoizAI

video-translation 技能可將影片中的口語內容翻譯成其他語言,生成 TTS 配音,並在保留影片內容不變的前提下替換或混合音訊。當你手上已有來源影片、字幕,以及要用來 Translation 的目標語言時,這個技能特別適合實際的影片翻譯使用情境。

翻译
收藏 0GitHub 498
N
tts

作者 NoizAI

tts skill 可將文字轉成語音音訊,適用於旁白、配音、口白,以及與時間軸對齊的播放。你可以用它把純文字產生為語音檔、將文章或文字檔轉成語音,或依 SRT 產生具時間控制的音訊。它支援簡單模式與時間軸模式,並提供可感知後端的工作流程,方便重複且穩定地使用 tts。

語音生成
收藏 0GitHub 498
N
sound-fx

作者 NoizAI

使用 sound-fx 技能把文字提示轉成音效、擬音、環境底音、怪物聲,以及 UI 音效。它很適合 Audio Editing 的 sound-fx、快速原型製作與可下載的音訊素材。先用 NoizAI/skills 安裝,再透過腳本式工作流程搭配有效的 Noiz API key 使用。**不適用於**語音、歌詞、旋律或聲音複製。

音频编辑
收藏 0GitHub 498
N
chat-with-anyone

作者 NoizAI

chat-with-anyone 可讓你從公開音訊複製真實人物的聲音,或根據圖片設計相符的聲音,接著用 TTS 生成合成回覆。它支援角色扮演、敘事與語音生成等實用工作流程,並提供安裝、來源選擇與安全使用的指引。

語音生成
收藏 0GitHub 498
O
speech

作者 openai

使用 speech 技能將文字轉成可播放的語音音訊,適用於旁白、配音、IVR 提示、無障礙朗讀與批次語音生成。它使用 OpenAI Audio API,內建 voices、隨附 CLI,並以 `OPENAI_API_KEY` 進行即時執行。自訂 voice 建立不在支援範圍內。

設計实现
收藏 0GitHub 0
音频编辑 Agent Skill