語音生成

瀏覽 設計 下與 語音生成 相關的 Agent Skill,並比較相近工作流、工具與使用情境。

10 个技能
I
ai-music-generation

作者 inferen-sh

透過 inference.sh CLI,結合 ElevenLabs Music、Diffrythm 與 Tencent Song Generation,從文字提示自動生成 AI 音樂與完整歌曲。非常適合用於背景配樂、配樂設計、社群短片、Podcast,以及免權利金音樂。支援快速生成歌曲、純伴奏與完整人聲歌曲。

語音生成
收藏 0GitHub 0
I
ai-podcast-creation

作者 inferen-sh

使用 Kokoro TTS、DIA TTS 和 inference.sh CLI,從文字建立由 AI 驅動的 Podcast 與語音內容。你可以混搭多種聲線、加入音樂,並組合完整的 Podcast、有聲書與音訊電子報集數。

語音生成
收藏 0GitHub 0
I
ai-voice-cloning

作者 inferen-sh

ai-voice-cloning 是一個基於 inference.sh 的技能,讓你可以從 CLI 執行 AI 語音產生、文字轉語音(TTS)以及語音複製。它包裝了 ElevenLabs、Kokoro TTS、DIA、Chatterbox、Higgs 和 VibeVoice 等模型,適合用於自然語音、多角色旁白,以及各種影音專案的語音轉換。

語音生成
收藏 0GitHub 0
I
dialogue-audio

作者 inferen-sh

透過 inference.sh CLI 結合 Dia TTS 與 ElevenLabs,生成逼真的多說話者對話音訊。dialogue-audio 技能可協助你掌控說話者、情緒、節奏與對話流暢度,適用於 Podcast、有聲書、解說內容、角色場景以及其他各種對話型內容。

語音生成
收藏 0GitHub 0
I
elevenlabs-dialogue

作者 inferen-sh

透過 inference.sh CLI 搭配 ElevenLabs,產生精緻、多說話者的對話音訊。將結構化腳本一次轉換成自然流暢的多角色對話單一音檔,適用於 Podcast、有聲書、解說影片、教學內容、角色對話與影音腳本。

語音生成
收藏 0GitHub 0
I
elevenlabs-dubbing

作者 inferen-sh

elevenlabs-dubbing 透過 inference.sh CLI,自動將音訊或視訊配音、翻譯成 29 種語言,同時保留原說話者的聲音特質。非常適合需要快速產出多語版本內容的剪輯師、Podcaster,以及在地化與後製團隊使用。

视频编辑
收藏 0GitHub 0
I
elevenlabs-music

作者 inferen-sh

透過 inference.sh CLI 搭配 ElevenLabs,從文字提示產生原創 AI 音樂。你可以控制長度、風格與情緒,在終端機裡直接創作免版稅的背景音樂、配樂、短鈴、Podcast 底音及遊戲音效。

音频编辑
收藏 0GitHub 0
I
elevenlabs-stt

作者 inferen-sh

透過 inference.sh CLI 串接 ElevenLabs Scribe v1/v2 模型,提供高準確度的語音轉文字服務。支援逐字稿轉寫、說話人分離、音訊事件標註、逐字時間戳、強制對齊,以及為會議、Podcast 等音訊流程產生字幕。

音频编辑
收藏 0GitHub 0
I
elevenlabs-tts

作者 inferen-sh

透過 inference.sh CLI 使用 ElevenLabs 文本轉語音(text-to-speech),提供 22+ 高級 Premium 聲音、多語系支援,以及適合正式上線環境的高速語音產生模型選項。

語音生成
收藏 0GitHub 0
I
elevenlabs-voice-changer

作者 inferen-sh

ElevenLabs voice changer 技能透過 inference.sh CLI(infsh)將錄製好的語音轉換成不同的合成聲音,同時保留原本的內容與情緒。支援 eleven_multilingual_sts_v2(70+ 種語言)與 eleven_english_sts_v2,可用於語音轉語音、口音變換與聲音偽裝,適合內容創作、配音與角色配音等情境。

語音生成
收藏 0GitHub 0