作者 remotion-dev
在 React 中建立程式化影片、動畫與音訊驅動合成時,實用的 Remotion 最佳實務指南。
作者 remotion-dev
在 React 中建立程式化影片、動畫與音訊驅動合成時,實用的 Remotion 最佳實務指南。
作者 inferen-sh
透過 inference.sh 執行、以 CLI 操作的 ElevenLabs voice isolator 技能,用來移除背景噪音並從音訊中分離人聲。非常適合清理 podcast、訪談、音樂人聲、嘈雜錄音,以及各種音訊修復流程。
作者 inferen-sh
使用 inference.sh CLI,從圖片與音訊軌生成 AI Avatar 與說話頭像(talking head)影片。ai-avatar-video 封裝了 OmniHuman、Fabric 和 PixVerse Lipsync 等應用,用於製作語音驅動的虛擬角色、對嘴影片與虛擬主持人,特別適合行銷、說明影片與社群內容的製作流程。
作者 inferen-sh
使用 inference.sh CLI 設計並執行多步驟 AI 內容產線,把影像、影片、音訊與文字工具串在一起。透過 ai-content-pipeline,自動化以下類型的流程:產生圖片、將圖片轉成動畫影片、加入音效或旁白,最後將內容整理好,用於 YouTube、社群媒體與行銷活動。
作者 inferen-sh
透過 inference.sh CLI,結合 ElevenLabs Music、Diffrythm 與 Tencent Song Generation,從文字提示自動生成 AI 音樂與完整歌曲。非常適合用於背景配樂、配樂設計、社群短片、Podcast,以及免權利金音樂。支援快速生成歌曲、純伴奏與完整人聲歌曲。
作者 inferen-sh
使用 Kokoro TTS、DIA TTS 和 inference.sh CLI,從文字建立由 AI 驅動的 Podcast 與語音內容。你可以混搭多種聲線、加入音樂,並組合完整的 Podcast、有聲書與音訊電子報集數。
作者 inferen-sh
適用於 TikTok、Instagram、YouTube 與 X 的 AI 社群內容產生器。透過 inference.sh CLI,搭配 FLUX、Veo、Seedance、Wan、Kokoro TTS 和 Claude 等模型,一鍵生成可直接上架的平台影片、reels、shorts、縮圖、圖片、文案與 hashtags。
作者 inferen-sh
ai-voice-cloning 是一個基於 inference.sh 的技能,讓你可以從 CLI 執行 AI 語音產生、文字轉語音(TTS)以及語音複製。它包裝了 ElevenLabs、Kokoro TTS、DIA、Chatterbox、Higgs 和 VibeVoice 等模型,適合用於自然語音、多角色旁白,以及各種影音專案的語音轉換。
作者 inferen-sh
透過 inference.sh CLI 結合 Dia TTS 與 ElevenLabs,生成逼真的多說話者對話音訊。dialogue-audio 技能可協助你掌控說話者、情緒、節奏與對話流暢度,適用於 Podcast、有聲書、解說內容、角色場景以及其他各種對話型內容。
作者 inferen-sh
透過 inference.sh CLI 搭配 ElevenLabs,產生精緻、多說話者的對話音訊。將結構化腳本一次轉換成自然流暢的多角色對話單一音檔,適用於 Podcast、有聲書、解說影片、教學內容、角色對話與影音腳本。
作者 inferen-sh
elevenlabs-dubbing 透過 inference.sh CLI,自動將音訊或視訊配音、翻譯成 29 種語言,同時保留原說話者的聲音特質。非常適合需要快速產出多語版本內容的剪輯師、Podcaster,以及在地化與後製團隊使用。
作者 inferen-sh
透過 inference.sh CLI 搭配 ElevenLabs,從文字提示產生原創 AI 音樂。你可以控制長度、風格與情緒,在終端機裡直接創作免版稅的背景音樂、配樂、短鈴、Podcast 底音及遊戲音效。
作者 inferen-sh
透過 inference.sh CLI 使用 ElevenLabs,從文字提示生成 AI 音效。非常適合需要快速、免版稅音效設計的影片剪輯師、遊戲開發者、Podcast 主持人、電影工作者與內容創作者。支援文字轉音效、可調整音訊長度,以及針對電影級、氛圍類與遊戲用 SFX 的提示控制。
作者 inferen-sh
透過 inference.sh CLI 串接 ElevenLabs Scribe v1/v2 模型,提供高準確度的語音轉文字服務。支援逐字稿轉寫、說話人分離、音訊事件標註、逐字時間戳、強制對齊,以及為會議、Podcast 等音訊流程產生字幕。
作者 inferen-sh
透過 inference.sh CLI 使用 ElevenLabs 文本轉語音(text-to-speech),提供 22+ 高級 Premium 聲音、多語系支援,以及適合正式上線環境的高速語音產生模型選項。
作者 inferen-sh
ElevenLabs voice changer 技能透過 inference.sh CLI(infsh)將錄製好的語音轉換成不同的合成聲音,同時保留原本的內容與情緒。支援 eleven_multilingual_sts_v2(70+ 種語言)與 eleven_english_sts_v2,可用於語音轉語音、口音變換與聲音偽裝,適合內容創作、配音與角色配音等情境。