语音生成

浏览设计下与语音生成相关的 Agent Skill，并比较相近工作流、工具与使用场景。

5 个技能

tts

作者 NoizAI

tts 技能可将文本转换为语音音频，适用于旁白、配音、配音解说和按时间轴对齐的播放。你可以用它把纯文本生成语音文件，将文章或文本文件转成语音，或生成带时间控制的 SRT 驱动音频。它支持简单模式和时间轴模式，也支持面向后端的工作流，便于重复、稳定地使用 tts。

语音生成

收藏 0GitHub 498

sound-fx

作者 NoizAI

使用 sound-fx 技能，把文本提示词转换成音效、拟音、环境底噪、怪物声音和 UI 音效。它适合用于音效编辑、快速原型验证和可下载音频素材制作。先通过 NoizAI/skills 安装，然后使用基于脚本的工作流，并准备有效的 Noiz API key。它不适用于语音、歌词、旋律或声音克隆。

音频编辑

收藏 0GitHub 498

characteristic-voice

作者 NoizAI

characteristic-voice 是一款用于生成温暖、像陪伴者一样、带有情感在场感的语音技能。适合安抚式回复、早安晚安消息、轻松闲聊，以及带停顿、笑声或温柔感的角色化表达。它包含基于预设的工作流和后端支持，便于实际使用 characteristic-voice。

语音生成

收藏 0GitHub 498

chat-with-anyone

作者 NoizAI

chat-with-anyone 可从公开音频克隆真实人物的声音，或根据图片设计匹配的声音，再通过 TTS 生成合成回复。它支持角色扮演、旁白和语音生成等实用工作流，并提供安装、素材选择和安全使用方面的指导。

语音生成

收藏 0GitHub 498

speech

作者 openai

使用 speech 技能将文本转换为可朗读的音频，适用于旁白、配音、IVR 提示、无障碍朗读和批量语音生成。它基于 OpenAI Audio API，内置 voices，附带 CLI，并在实际运行时需要 `OPENAI_API_KEY`。不支持自定义 voice 创建。

设计实现

收藏 0GitHub 0