by remotion-dev
React에서 프로그램 방식으로 영상, 애니메이션, 오디오 기반 컴포지션을 만들 때 활용할 수 있는 실전 Remotion 베스트 프랙티스 모음입니다.
by remotion-dev
React에서 프로그램 방식으로 영상, 애니메이션, 오디오 기반 컴포지션을 만들 때 활용할 수 있는 실전 Remotion 베스트 프랙티스 모음입니다.
by inferen-sh
inference.sh를 통해 오디오의 배경 소음을 제거하고 보컬을 분리하는 CLI 기반 ElevenLabs voice isolator 스킬입니다. 팟캐스트 정리, 인터뷰, 음악 보컬, 소음 많은 녹음, 오디오 복원 워크플로에 이상적입니다.
by inferen-sh
inference.sh CLI를 사용해 이미지와 오디오 트랙에서 AI 아바타·토킹 헤드 영상을 생성합니다. ai-avatar-video는 OmniHuman, Fabric, PixVerse Lipsync 앱을 감싸 오디오 기반 아바타, 립싱크 영상, 버추얼 프레젠터를 만들 수 있도록 해 주며, 마케팅·설명 영상·소셜 콘텐츠 워크플로에 적합합니다.
by inferen-sh
inference.sh CLI를 통해 이미지, 동영상, 오디오, 텍스트 도구를 단계별로 연결하는 멀티스텝 AI 콘텐츠 파이프라인을 설계하고 실행할 수 있습니다. ai-content-pipeline을 사용해 ‘이미지 생성 → 영상으로 애니메이션화 → 사운드/보이스오버 추가 → YouTube·소셜 미디어·마케팅 캠페인용 콘텐츠 준비’ 같은 워크플로를 자동화할 수 있습니다.
by inferen-sh
inference.sh CLI를 통해 ElevenLabs Music, Diffrythm, Tencent Song Generation을 사용해 텍스트 프롬프트에서 AI 음악과 완성된 곡을 생성합니다. 배경 음악, 사운드트랙, 숏폼 영상, 팟캐스트, 로열티 프리 음악 제작에 적합합니다. 빠른 곡 생성, 연주곡(Instrumental), 보컬이 포함된 풀송을 모두 지원합니다.
by inferen-sh
Kokoro TTS, DIA TTS, 그리고 inference.sh CLI를 활용해 텍스트에서 AI 기반 팟캐스트와 음성 콘텐츠를 생성합니다. 여러 보이스를 섞고, 음악을 추가하며, 팟캐스트·오디오북·오디오 뉴스레터용 전체 에피소드를 구성할 수 있습니다.
by inferen-sh
TikTok, Instagram, YouTube, X용 소셜 미디어 콘텐츠를 AI로 생성하는 스킬입니다. inference.sh CLI를 사용해 FLUX, Veo, Seedance, Wan, Kokoro TTS, Claude 같은 모델로 플랫폼에 바로 올릴 수 있는 영상, 릴스, 쇼츠, 썸네일, 이미지, 캡션, 해시태그를 만들어 보세요.
by inferen-sh
ai-voice-cloning은 CLI에서 사용할 수 있는 AI 음성 생성, 텍스트 음성 변환(TTS), 음성 클로닝 스킬로, inference.sh 기반으로 동작합니다. ElevenLabs, Kokoro TTS, DIA, Chatterbox, Higgs, VibeVoice 모델을 래핑해 자연스러운 음성, 멀티 보이스 내레이션, 오디오·영상 프로젝트용 음성 변환을 제공합니다.
by inferen-sh
inference.sh CLI를 통해 Dia TTS 및 ElevenLabs를 사용해 현실감 있는 멀티 스피커 대화 오디오를 생성합니다. dialogue-audio 스킬은 팟캐스트, 오디오북, 설명 영상, 캐릭터 연기 등 대화형 콘텐츠에서 화자, 감정, 속도, 대화 흐름을 세밀하게 제어할 수 있게 도와줍니다.
by inferen-sh
inference.sh CLI를 통해 ElevenLabs로 다중 화자 대화 오디오를 매끄럽게 생성합니다. 구조화된 스크립트를 팟캐스트, 오디오북, 설명 영상, 튜토리얼, 캐릭터 대사, 영상 대본 등에 쓸 수 있는 자연스러운 다인 대화 음성(단일 파일)으로 변환합니다.
by inferen-sh
elevenlabs-dubbing은 inference.sh CLI를 사용해 오디오나 비디오를 29개 언어로 자동 더빙 및 번역하면서, 원본 화자의 목소리 특성을 최대한 유지해 줍니다. 기존 콘텐츠를 빠르고 고품질의 다국어 버전으로 제작해야 하는 영상 편집자, 팟캐스터, 로컬라이제이션 팀에 적합합니다.
by inferen-sh
inference.sh CLI와 ElevenLabs를 사용해 텍스트 프롬프트만으로 오리지널 AI 음악을 생성하세요. 길이, 스타일, 분위기를 제어해 로열티 프리 배경 음악, 사운드트랙, 징글, 팟캐스트 배경음, 게임 오디오를 터미널에서 바로 만들어낼 수 있습니다.
by inferen-sh
inference.sh CLI를 통해 ElevenLabs를 사용해 텍스트 프롬프트에서 AI 사운드 이펙트를 생성합니다. 빠르고 로열티 프리인 사운드 디자인이 필요한 영상 편집자, 게임 개발자, 팟캐스터, 영화 제작자, 콘텐츠 크리에이터에게 적합합니다. 텍스트-투-사운드 이펙트, 길이 조정, 시네마틱 · 앰비언트 · 게임용 SFX를 위한 프롬프트 컨트롤을 지원합니다.
by inferen-sh
inference.sh CLI를 통해 ElevenLabs Scribe v1/v2 모델을 사용하는 고정확도 음성 인식 스킬입니다. 회의, 팟캐스트 등 다양한 오디오 워크플로에서 전사, 화자 분리, 오디오 이벤트 태깅, 단어 단위 타임스탬프, 강제 정렬, 자막 생성 등을 지원합니다.
by inferen-sh
inference.sh CLI를 통해 ElevenLabs 텍스트-투-스피치(TTS)를 사용하는 스킬로, 22개 이상 프리미엄 보이스, 다국어 지원, 프로덕션 환경에 적합한 고속 모델 옵션을 제공합니다.
by inferen-sh
inference.sh CLI(`infsh`)를 사용하는 ElevenLabs 음성 변조 스킬로, 녹음된 음성을 내용과 감정은 그대로 유지한 채 다른 합성 음성으로 변환합니다. eleven_multilingual_sts_v2(70개+ 언어)와 eleven_english_sts_v2를 지원하며, 음성-대-음성 변환, 억양 변경, 음성 변조를 이용한 콘텐츠 제작, 더빙, 캐릭터 보이스에 활용할 수 있습니다.