Voice Generation

디자인 안에서 Voice Generation 관련 Agent Skill을 살펴보고 비슷한 워크플로와 활용 사례를 비교하세요.

8 skills
I
ai-voice-cloning

by inferen-sh

ai-voice-cloning은 CLI에서 사용할 수 있는 AI 음성 생성, 텍스트 음성 변환(TTS), 음성 클로닝 스킬로, inference.sh 기반으로 동작합니다. ElevenLabs, Kokoro TTS, DIA, Chatterbox, Higgs, VibeVoice 모델을 래핑해 자연스러운 음성, 멀티 보이스 내레이션, 오디오·영상 프로젝트용 음성 변환을 제공합니다.

Voice Generation
Favorites 0GitHub 0
I
dialogue-audio

by inferen-sh

inference.sh CLI를 통해 Dia TTS 및 ElevenLabs를 사용해 현실감 있는 멀티 스피커 대화 오디오를 생성합니다. dialogue-audio 스킬은 팟캐스트, 오디오북, 설명 영상, 캐릭터 연기 등 대화형 콘텐츠에서 화자, 감정, 속도, 대화 흐름을 세밀하게 제어할 수 있게 도와줍니다.

Voice Generation
Favorites 0GitHub 0
I
elevenlabs-dialogue

by inferen-sh

inference.sh CLI를 통해 ElevenLabs로 다중 화자 대화 오디오를 매끄럽게 생성합니다. 구조화된 스크립트를 팟캐스트, 오디오북, 설명 영상, 튜토리얼, 캐릭터 대사, 영상 대본 등에 쓸 수 있는 자연스러운 다인 대화 음성(단일 파일)으로 변환합니다.

Voice Generation
Favorites 0GitHub 0
I
elevenlabs-dubbing

by inferen-sh

elevenlabs-dubbing은 inference.sh CLI를 사용해 오디오나 비디오를 29개 언어로 자동 더빙 및 번역하면서, 원본 화자의 목소리 특성을 최대한 유지해 줍니다. 기존 콘텐츠를 빠르고 고품질의 다국어 버전으로 제작해야 하는 영상 편집자, 팟캐스터, 로컬라이제이션 팀에 적합합니다.

Video Editing
Favorites 0GitHub 0
I
elevenlabs-music

by inferen-sh

inference.sh CLI와 ElevenLabs를 사용해 텍스트 프롬프트만으로 오리지널 AI 음악을 생성하세요. 길이, 스타일, 분위기를 제어해 로열티 프리 배경 음악, 사운드트랙, 징글, 팟캐스트 배경음, 게임 오디오를 터미널에서 바로 만들어낼 수 있습니다.

Audio Editing
Favorites 0GitHub 0
I
elevenlabs-stt

by inferen-sh

inference.sh CLI를 통해 ElevenLabs Scribe v1/v2 모델을 사용하는 고정확도 음성 인식 스킬입니다. 회의, 팟캐스트 등 다양한 오디오 워크플로에서 전사, 화자 분리, 오디오 이벤트 태깅, 단어 단위 타임스탬프, 강제 정렬, 자막 생성 등을 지원합니다.

Audio Editing
Favorites 0GitHub 0
I
elevenlabs-tts

by inferen-sh

inference.sh CLI를 통해 ElevenLabs 텍스트-투-스피치(TTS)를 사용하는 스킬로, 22개 이상 프리미엄 보이스, 다국어 지원, 프로덕션 환경에 적합한 고속 모델 옵션을 제공합니다.

Voice Generation
Favorites 0GitHub 0
I
elevenlabs-voice-changer

by inferen-sh

inference.sh CLI(`infsh`)를 사용하는 ElevenLabs 음성 변조 스킬로, 녹음된 음성을 내용과 감정은 그대로 유지한 채 다른 합성 음성으로 변환합니다. eleven_multilingual_sts_v2(70개+ 언어)와 eleven_english_sts_v2를 지원하며, 음성-대-음성 변환, 억양 변경, 음성 변조를 이용한 콘텐츠 제작, 더빙, 캐릭터 보이스에 활용할 수 있습니다.

Voice Generation
Favorites 0GitHub 0