작성자 affaan-m
fal-ai-media는 fal.ai MCP를 통해 이미지, 비디오, 음성, 오디오를 한 번에 다루는 미디어 생성용 GitHub 스킬입니다. 이미지 생성, 이미지 편집, 비디오, 음성, 오디오 워크플로에 맞춰 fal-ai-media 스킬을 설치하고 활용하는 데 도움이 되며, 모델 검색, 비용 확인, 안내 프롬프트까지 함께 제공합니다.
작성자 affaan-m
fal-ai-media는 fal.ai MCP를 통해 이미지, 비디오, 음성, 오디오를 한 번에 다루는 미디어 생성용 GitHub 스킬입니다. 이미지 생성, 이미지 편집, 비디오, 음성, 오디오 워크플로에 맞춰 fal-ai-media 스킬을 설치하고 활용하는 데 도움이 되며, 모델 검색, 비용 확인, 안내 프롬프트까지 함께 제공합니다.
작성자 NoizAI
video-translation 스킬은 영상의 음성 내용을 다른 언어로 번역하고, TTS 더빙을 생성한 뒤, 영상을 그대로 유지한 채 오디오를 교체하거나 믹스합니다. 소스 영상과 자막, 그리고 번역할 대상 언어가 있을 때 실무적인 영상 번역 용도로 가장 적합합니다.
작성자 NoizAI
tts 스킬은 텍스트를 음성 오디오로 바꿔 내레이션, 더빙, 보이스오버, 타임라인 맞춤 재생에 활용할 수 있습니다. 일반 텍스트로 음성 파일을 만들고, 기사나 텍스트 파일을 음성으로 변환하고, 시간 제어가 필요한 SRT 기반 오디오를 렌더링하는 데 유용합니다. 단순 모드와 타임라인 모드를 모두 지원하며, 반복 가능한 tts 사용을 위한 백엔드 인식 워크플로도 제공합니다.
작성자 NoizAI
sound-fx 스킬로 텍스트 프롬프트를 효과음, 폴리, 앰비언트 베드, 크리처 사운드, UI 노이즈로 바꿔보세요. 오디오 편집, 빠른 프로토타이핑, 다운로드 가능한 오디오 자산 제작에 잘 맞습니다. NoizAI/skills로 설치한 뒤, 유효한 Noiz API 키를 사용해 스크립트 기반 워크플로로 실행합니다. 음성, 가사, 멜로디, 보이스 클로닝 용도에는 적합하지 않습니다.
작성자 NoizAI
chat-with-anyone은 공개 음성에서 실제 인물의 목소리를 복제하거나, 이미지를 바탕으로 어울리는 목소리를 설계한 뒤 TTS로 합성 응답을 생성하는 기능입니다. 역할극, 내레이션, 음성 생성 같은 실무 흐름을 지원하며, 설치 방법, 소스 선택, 안전한 사용까지 함께 안내합니다.
작성자 openai
speech 스킬로 텍스트를 내레이션, 보이스오버, IVR 안내 멘트, 접근성용 읽기, 배치 음성 생성용 음성 오디오로 바꿀 수 있습니다. 내장 음성, 번들 CLI, 실시간 실행용 `OPENAI_API_KEY`를 사용하는 OpenAI Audio API 기반이며, 사용자 지정 음성 생성은 범위에 포함되지 않습니다.