by inferen-sh
Skill elevenlabs-voice-isolator chạy qua CLI để khử ồn nền và tách giọng nói/vocal khỏi audio bằng inference.sh. Lý tưởng cho dọn sạch podcast, phỏng vấn, vocal nhạc, bản thu ồn và các quy trình khôi phục âm thanh.
by inferen-sh
Skill elevenlabs-voice-isolator chạy qua CLI để khử ồn nền và tách giọng nói/vocal khỏi audio bằng inference.sh. Lý tưởng cho dọn sạch podcast, phỏng vấn, vocal nhạc, bản thu ồn và các quy trình khôi phục âm thanh.
by inferen-sh
Thiết kế và vận hành các pipeline nội dung AI nhiều bước, xâu chuỗi công cụ hình ảnh, video, âm thanh và văn bản lại với nhau thông qua inference.sh CLI. Dùng ai-content-pipeline để tự động hóa các quy trình như: tạo ảnh, dựng thành video, thêm âm thanh hoặc lời thuyết minh, và chuẩn bị nội dung cho YouTube, mạng xã hội và các chiến dịch marketing.
by inferen-sh
Tạo nhạc AI và bài hát hoàn chỉnh từ prompt văn bản bằng ElevenLabs Music, Diffrythm và Tencent Song Generation thông qua CLI inference.sh. Lý tưởng cho nhạc nền, soundtrack, clip mạng xã hội, podcast và nhạc không bản quyền. Hỗ trợ tạo bài hát nhanh, bản nhạc không lời và bài hát đầy đủ giọng hát.
by inferen-sh
Tạo podcast và nội dung giọng nói dùng AI từ văn bản với Kokoro TTS, DIA TTS và CLI inference.sh. Trộn nhiều giọng, thêm nhạc và lắp ráp trọn vẹn các tập cho podcast, sách nói và bản tin âm thanh.
by inferen-sh
ai-voice-cloning là một kỹ năng dựa trên inference.sh để tạo giọng nói AI, text-to-speech và nhân bản giọng nói từ CLI. Nó bao bọc các mô hình ElevenLabs, Kokoro TTS, DIA, Chatterbox, Higgs và VibeVoice để tạo giọng nói tự nhiên, đọc nhiều giọng, và biến đổi giọng nói cho các dự án audio và video.
by inferen-sh
Tạo audio hội thoại nhiều người nói chân thực với Dia TTS và ElevenLabs thông qua CLI inference.sh. Kỹ năng dialogue-audio giúp bạn kiểm soát người nói, cảm xúc, nhịp độ và dòng chảy cuộc trò chuyện cho podcast, sách nói, video giải thích, cảnh nhân vật và các nội dung mang tính đối thoại khác.
by inferen-sh
Tạo audio hội thoại nhiều người nói được xử lý mượt mà với ElevenLabs thông qua CLI inference.sh. Biến kịch bản có cấu trúc thành các cuộc trò chuyện tự nhiên với nhiều giọng trong một file duy nhất cho podcast, sách nói, video giải thích, hướng dẫn, thoại nhân vật và kịch bản video.
by inferen-sh
elevenlabs-dubbing cho phép bạn tự động lồng tiếng và dịch âm thanh hoặc video sang 29 ngôn ngữ bằng CLI inference.sh, đồng thời giữ nguyên giọng nói của người nói ban đầu. Rất phù hợp cho biên tập viên video, podcaster và các đội ngũ bản địa hóa cần tạo nhanh phiên bản đa ngôn ngữ chất lượng cao cho nội dung sẵn có.
by inferen-sh
Tạo nhạc AI gốc từ prompt văn bản bằng inference.sh CLI và ElevenLabs. Kiểm soát độ dài, phong cách và mood để tạo nhạc nền, soundtrack, jingle, nhạc lót podcast và âm thanh game không bản quyền trực tiếp từ terminal của bạn.
by inferen-sh
Tạo hiệu ứng âm thanh AI từ prompt văn bản bằng ElevenLabs thông qua công cụ dòng lệnh inference.sh. Lý tưởng cho biên tập video, nhà phát triển game, podcaster, nhà làm phim và creator nội dung cần thiết kế âm thanh nhanh, không lo bản quyền. Hỗ trợ chuyển văn bản thành hiệu ứng âm thanh, tùy chỉnh độ dài và kiểm soát prompt cho SFX cinematic, ambient và sẵn sàng dùng trong game.
by inferen-sh
Chuyển giọng nói thành văn bản độ chính xác cao với ElevenLabs thông qua inference.sh CLI, dùng các model Scribe v1/v2. Hỗ trợ nhận dạng lời nói, phân tách người nói, gắn nhãn sự kiện âm thanh, timestamp theo từng từ, forced alignment và tạo phụ đề cho họp, podcast và các quy trình xử lý audio khác.
by inferen-sh
ElevenLabs text-to-speech thông qua inference.sh CLI, với hơn 22 giọng đọc cao cấp, hỗ trợ đa ngôn ngữ và các tùy chọn model nhanh cho quy trình tạo giọng nói phục vụ sản xuất.
by inferen-sh
Skill ElevenLabs voice changer sử dụng CLI inference.sh (infsh) để biến đổi giọng nói ghi âm sang một giọng tổng hợp khác, vẫn giữ nguyên nội dung và cảm xúc. Hỗ trợ eleven_multilingual_sts_v2 (hơn 70 ngôn ngữ) và eleven_english_sts_v2 cho tác vụ speech-to-speech, đổi accent và ngụy trang giọng nói trong sáng tạo nội dung, lồng tiếng và tạo giọng nhân vật.