Voice Generation

Kham pha Agent Skill cho Voice Generation trong Thiet ke va so sanh workflow, cong cu va tinh huong lien quan.

5 skills

tts

bởi NoizAI

Kỹ năng tts biến văn bản thành âm thanh giọng nói cho thuyết minh, lồng tiếng, voiceover và phát theo mốc thời gian. Bạn có thể dùng nó để tạo file giọng nói từ văn bản thuần, chuyển bài viết hoặc file text thành speech, hoặc render âm thanh từ SRT với khả năng kiểm soát timing. Kỹ năng hỗ trợ chế độ đơn giản và chế độ theo timeline, cùng các quy trình làm việc nhận biết backend để dùng tts lặp lại một cách ổn định.

Voice Generation

Yêu thích 0GitHub 498

sound-fx

bởi NoizAI

Dùng kỹ năng sound-fx để biến prompt văn bản thành hiệu ứng âm thanh, foley, nền âm thanh môi trường, tiếng sinh vật và tiếng UI. Kỹ năng này phù hợp cho sound-fx trong Chỉnh sửa âm thanh, tạo mẫu nhanh và tạo tài sản âm thanh có thể tải xuống. Cài đặt qua NoizAI/skills, sau đó dùng quy trình làm việc dựa trên script với một Noiz API key hợp lệ. Không dành cho giọng nói, lời bài hát, giai điệu hoặc sao chép giọng.

Audio Editing

Yêu thích 0GitHub 498

characteristic-voice

bởi NoizAI

characteristic-voice là một kỹ năng tạo giọng nói cho kiểu lời thoại ấm áp, như người đồng hành, giàu cảm xúc. Dùng cho các câu trả lời an ủi, tin nhắn buổi sáng hoặc ban đêm, đối đáp đời thường, và cách thể hiện theo phong cách nhân vật với nhịp ngắt, tiếng cười nhẹ hoặc sự dịu dàng. Kỹ năng này có quy trình làm việc dựa trên preset và hỗ trợ backend để sử dụng characteristic-voice một cách thực tế.

Voice Generation

Yêu thích 0GitHub 498

chat-with-anyone

bởi NoizAI

chat-with-anyone giúp bạn sao chép giọng nói của một người thật từ audio công khai hoặc thiết kế một giọng nói tương thích từ một hình ảnh, rồi tạo câu trả lời tổng hợp bằng TTS. Skill này hỗ trợ các quy trình thực tế cho roleplay, tường thuật và tạo giọng nói, kèm hướng dẫn về cài đặt, chọn nguồn và sử dụng an toàn.

Voice Generation

Yêu thích 0GitHub 498

speech

bởi openai

Dùng skill speech để chuyển văn bản thành âm thanh nói cho phần tường thuật, voiceover, lời nhắc IVR, nội dung đọc hỗ trợ khả năng tiếp cận và tạo giọng nói hàng loạt. Skill này dùng OpenAI Audio API với các giọng có sẵn, CLI đi kèm và `OPENAI_API_KEY` cho các lần chạy trực tiếp. Tạo giọng tùy chỉnh không thuộc phạm vi.

Design Implementation

Yêu thích 0GitHub 0