音频

瀏覽帶有 音频 標籤的 Agent Skill,並比較目錄中的相關工作流與詳情頁。

16 个技能
R
remotion-best-practices

作者 remotion-dev

在 React 中建立程式化影片、動畫與音訊驅動合成時,實用的 Remotion 最佳實務指南。

视频编辑
收藏 0GitHub 2411
I
elevenlabs-voice-isolator

作者 inferen-sh

透過 inference.sh 執行、以 CLI 操作的 ElevenLabs voice isolator 技能,用來移除背景噪音並從音訊中分離人聲。非常適合清理 podcast、訪談、音樂人聲、嘈雜錄音,以及各種音訊修復流程。

音频编辑
收藏 0GitHub 232
I
ai-avatar-video

作者 inferen-sh

使用 inference.sh CLI,從圖片與音訊軌生成 AI Avatar 與說話頭像(talking head)影片。ai-avatar-video 封裝了 OmniHuman、Fabric 和 PixVerse Lipsync 等應用,用於製作語音驅動的虛擬角色、對嘴影片與虛擬主持人,特別適合行銷、說明影片與社群內容的製作流程。

视频编辑
收藏 0GitHub 0
I
ai-content-pipeline

作者 inferen-sh

使用 inference.sh CLI 設計並執行多步驟 AI 內容產線,把影像、影片、音訊與文字工具串在一起。透過 ai-content-pipeline,自動化以下類型的流程:產生圖片、將圖片轉成動畫影片、加入音效或旁白,最後將內容整理好,用於 YouTube、社群媒體與行銷活動。

工作流自動化
收藏 0GitHub 0
I
ai-music-generation

作者 inferen-sh

透過 inference.sh CLI,結合 ElevenLabs Music、Diffrythm 與 Tencent Song Generation,從文字提示自動生成 AI 音樂與完整歌曲。非常適合用於背景配樂、配樂設計、社群短片、Podcast,以及免權利金音樂。支援快速生成歌曲、純伴奏與完整人聲歌曲。

語音生成
收藏 0GitHub 0
I
ai-podcast-creation

作者 inferen-sh

使用 Kokoro TTS、DIA TTS 和 inference.sh CLI,從文字建立由 AI 驅動的 Podcast 與語音內容。你可以混搭多種聲線、加入音樂,並組合完整的 Podcast、有聲書與音訊電子報集數。

語音生成
收藏 0GitHub 0
I
ai-social-media-content

作者 inferen-sh

適用於 TikTok、Instagram、YouTube 與 X 的 AI 社群內容產生器。透過 inference.sh CLI,搭配 FLUX、Veo、Seedance、Wan、Kokoro TTS 和 Claude 等模型,一鍵生成可直接上架的平台影片、reels、shorts、縮圖、圖片、文案與 hashtags。

社交媒体
收藏 0GitHub 0
I
ai-voice-cloning

作者 inferen-sh

ai-voice-cloning 是一個基於 inference.sh 的技能,讓你可以從 CLI 執行 AI 語音產生、文字轉語音(TTS)以及語音複製。它包裝了 ElevenLabs、Kokoro TTS、DIA、Chatterbox、Higgs 和 VibeVoice 等模型,適合用於自然語音、多角色旁白,以及各種影音專案的語音轉換。

語音生成
收藏 0GitHub 0
I
dialogue-audio

作者 inferen-sh

透過 inference.sh CLI 結合 Dia TTS 與 ElevenLabs,生成逼真的多說話者對話音訊。dialogue-audio 技能可協助你掌控說話者、情緒、節奏與對話流暢度,適用於 Podcast、有聲書、解說內容、角色場景以及其他各種對話型內容。

語音生成
收藏 0GitHub 0
I
elevenlabs-dialogue

作者 inferen-sh

透過 inference.sh CLI 搭配 ElevenLabs,產生精緻、多說話者的對話音訊。將結構化腳本一次轉換成自然流暢的多角色對話單一音檔,適用於 Podcast、有聲書、解說影片、教學內容、角色對話與影音腳本。

語音生成
收藏 0GitHub 0
I
elevenlabs-dubbing

作者 inferen-sh

elevenlabs-dubbing 透過 inference.sh CLI,自動將音訊或視訊配音、翻譯成 29 種語言,同時保留原說話者的聲音特質。非常適合需要快速產出多語版本內容的剪輯師、Podcaster,以及在地化與後製團隊使用。

视频编辑
收藏 0GitHub 0
I
elevenlabs-music

作者 inferen-sh

透過 inference.sh CLI 搭配 ElevenLabs,從文字提示產生原創 AI 音樂。你可以控制長度、風格與情緒,在終端機裡直接創作免版稅的背景音樂、配樂、短鈴、Podcast 底音及遊戲音效。

音频编辑
收藏 0GitHub 0
I
elevenlabs-sound-effects

作者 inferen-sh

透過 inference.sh CLI 使用 ElevenLabs,從文字提示生成 AI 音效。非常適合需要快速、免版稅音效設計的影片剪輯師、遊戲開發者、Podcast 主持人、電影工作者與內容創作者。支援文字轉音效、可調整音訊長度,以及針對電影級、氛圍類與遊戲用 SFX 的提示控制。

音频编辑
收藏 0GitHub 0
I
elevenlabs-stt

作者 inferen-sh

透過 inference.sh CLI 串接 ElevenLabs Scribe v1/v2 模型,提供高準確度的語音轉文字服務。支援逐字稿轉寫、說話人分離、音訊事件標註、逐字時間戳、強制對齊,以及為會議、Podcast 等音訊流程產生字幕。

音频编辑
收藏 0GitHub 0
I
elevenlabs-tts

作者 inferen-sh

透過 inference.sh CLI 使用 ElevenLabs 文本轉語音(text-to-speech),提供 22+ 高級 Premium 聲音、多語系支援,以及適合正式上線環境的高速語音產生模型選項。

語音生成
收藏 0GitHub 0
I
elevenlabs-voice-changer

作者 inferen-sh

ElevenLabs voice changer 技能透過 inference.sh CLI(infsh)將錄製好的語音轉換成不同的合成聲音,同時保留原本的內容與情緒。支援 eleven_multilingual_sts_v2(70+ 種語言)與 eleven_english_sts_v2,可用於語音轉語音、口音變換與聲音偽裝,適合內容創作、配音與角色配音等情境。

語音生成
收藏 0GitHub 0