Audio

Audio 태그가 붙은 Agent Skill을 찾아보고 관련 워크플로를 비교하세요.

16 skills
R
remotion-best-practices

by remotion-dev

React에서 프로그램 방식으로 영상, 애니메이션, 오디오 기반 컴포지션을 만들 때 활용할 수 있는 실전 Remotion 베스트 프랙티스 모음입니다.

Video Editing
Favorites 0GitHub 2.4천
I
elevenlabs-voice-isolator

by inferen-sh

inference.sh를 통해 오디오의 배경 소음을 제거하고 보컬을 분리하는 CLI 기반 ElevenLabs voice isolator 스킬입니다. 팟캐스트 정리, 인터뷰, 음악 보컬, 소음 많은 녹음, 오디오 복원 워크플로에 이상적입니다.

Audio Editing
Favorites 0GitHub 232
I
ai-avatar-video

by inferen-sh

inference.sh CLI를 사용해 이미지와 오디오 트랙에서 AI 아바타·토킹 헤드 영상을 생성합니다. ai-avatar-video는 OmniHuman, Fabric, PixVerse Lipsync 앱을 감싸 오디오 기반 아바타, 립싱크 영상, 버추얼 프레젠터를 만들 수 있도록 해 주며, 마케팅·설명 영상·소셜 콘텐츠 워크플로에 적합합니다.

Video Editing
Favorites 0GitHub 0
I
ai-content-pipeline

by inferen-sh

inference.sh CLI를 통해 이미지, 동영상, 오디오, 텍스트 도구를 단계별로 연결하는 멀티스텝 AI 콘텐츠 파이프라인을 설계하고 실행할 수 있습니다. ai-content-pipeline을 사용해 ‘이미지 생성 → 영상으로 애니메이션화 → 사운드/보이스오버 추가 → YouTube·소셜 미디어·마케팅 캠페인용 콘텐츠 준비’ 같은 워크플로를 자동화할 수 있습니다.

Workflow Automation
Favorites 0GitHub 0
I
ai-music-generation

by inferen-sh

inference.sh CLI를 통해 ElevenLabs Music, Diffrythm, Tencent Song Generation을 사용해 텍스트 프롬프트에서 AI 음악과 완성된 곡을 생성합니다. 배경 음악, 사운드트랙, 숏폼 영상, 팟캐스트, 로열티 프리 음악 제작에 적합합니다. 빠른 곡 생성, 연주곡(Instrumental), 보컬이 포함된 풀송을 모두 지원합니다.

Voice Generation
Favorites 0GitHub 0
I
ai-podcast-creation

by inferen-sh

Kokoro TTS, DIA TTS, 그리고 inference.sh CLI를 활용해 텍스트에서 AI 기반 팟캐스트와 음성 콘텐츠를 생성합니다. 여러 보이스를 섞고, 음악을 추가하며, 팟캐스트·오디오북·오디오 뉴스레터용 전체 에피소드를 구성할 수 있습니다.

Voice Generation
Favorites 0GitHub 0
I
ai-social-media-content

by inferen-sh

TikTok, Instagram, YouTube, X용 소셜 미디어 콘텐츠를 AI로 생성하는 스킬입니다. inference.sh CLI를 사용해 FLUX, Veo, Seedance, Wan, Kokoro TTS, Claude 같은 모델로 플랫폼에 바로 올릴 수 있는 영상, 릴스, 쇼츠, 썸네일, 이미지, 캡션, 해시태그를 만들어 보세요.

Social Media
Favorites 0GitHub 0
I
ai-voice-cloning

by inferen-sh

ai-voice-cloning은 CLI에서 사용할 수 있는 AI 음성 생성, 텍스트 음성 변환(TTS), 음성 클로닝 스킬로, inference.sh 기반으로 동작합니다. ElevenLabs, Kokoro TTS, DIA, Chatterbox, Higgs, VibeVoice 모델을 래핑해 자연스러운 음성, 멀티 보이스 내레이션, 오디오·영상 프로젝트용 음성 변환을 제공합니다.

Voice Generation
Favorites 0GitHub 0
I
dialogue-audio

by inferen-sh

inference.sh CLI를 통해 Dia TTS 및 ElevenLabs를 사용해 현실감 있는 멀티 스피커 대화 오디오를 생성합니다. dialogue-audio 스킬은 팟캐스트, 오디오북, 설명 영상, 캐릭터 연기 등 대화형 콘텐츠에서 화자, 감정, 속도, 대화 흐름을 세밀하게 제어할 수 있게 도와줍니다.

Voice Generation
Favorites 0GitHub 0
I
elevenlabs-dialogue

by inferen-sh

inference.sh CLI를 통해 ElevenLabs로 다중 화자 대화 오디오를 매끄럽게 생성합니다. 구조화된 스크립트를 팟캐스트, 오디오북, 설명 영상, 튜토리얼, 캐릭터 대사, 영상 대본 등에 쓸 수 있는 자연스러운 다인 대화 음성(단일 파일)으로 변환합니다.

Voice Generation
Favorites 0GitHub 0
I
elevenlabs-dubbing

by inferen-sh

elevenlabs-dubbing은 inference.sh CLI를 사용해 오디오나 비디오를 29개 언어로 자동 더빙 및 번역하면서, 원본 화자의 목소리 특성을 최대한 유지해 줍니다. 기존 콘텐츠를 빠르고 고품질의 다국어 버전으로 제작해야 하는 영상 편집자, 팟캐스터, 로컬라이제이션 팀에 적합합니다.

Video Editing
Favorites 0GitHub 0
I
elevenlabs-music

by inferen-sh

inference.sh CLI와 ElevenLabs를 사용해 텍스트 프롬프트만으로 오리지널 AI 음악을 생성하세요. 길이, 스타일, 분위기를 제어해 로열티 프리 배경 음악, 사운드트랙, 징글, 팟캐스트 배경음, 게임 오디오를 터미널에서 바로 만들어낼 수 있습니다.

Audio Editing
Favorites 0GitHub 0
I
elevenlabs-sound-effects

by inferen-sh

inference.sh CLI를 통해 ElevenLabs를 사용해 텍스트 프롬프트에서 AI 사운드 이펙트를 생성합니다. 빠르고 로열티 프리인 사운드 디자인이 필요한 영상 편집자, 게임 개발자, 팟캐스터, 영화 제작자, 콘텐츠 크리에이터에게 적합합니다. 텍스트-투-사운드 이펙트, 길이 조정, 시네마틱 · 앰비언트 · 게임용 SFX를 위한 프롬프트 컨트롤을 지원합니다.

Audio Editing
Favorites 0GitHub 0
I
elevenlabs-stt

by inferen-sh

inference.sh CLI를 통해 ElevenLabs Scribe v1/v2 모델을 사용하는 고정확도 음성 인식 스킬입니다. 회의, 팟캐스트 등 다양한 오디오 워크플로에서 전사, 화자 분리, 오디오 이벤트 태깅, 단어 단위 타임스탬프, 강제 정렬, 자막 생성 등을 지원합니다.

Audio Editing
Favorites 0GitHub 0
I
elevenlabs-tts

by inferen-sh

inference.sh CLI를 통해 ElevenLabs 텍스트-투-스피치(TTS)를 사용하는 스킬로, 22개 이상 프리미엄 보이스, 다국어 지원, 프로덕션 환경에 적합한 고속 모델 옵션을 제공합니다.

Voice Generation
Favorites 0GitHub 0
I
elevenlabs-voice-changer

by inferen-sh

inference.sh CLI(`infsh`)를 사용하는 ElevenLabs 음성 변조 스킬로, 녹음된 음성을 내용과 감정은 그대로 유지한 채 다른 합성 음성으로 변환합니다. eleven_multilingual_sts_v2(70개+ 언어)와 eleven_english_sts_v2를 지원하며, 음성-대-음성 변환, 억양 변경, 음성 변조를 이용한 콘텐츠 제작, 더빙, 캐릭터 보이스에 활용할 수 있습니다.

Voice Generation
Favorites 0GitHub 0