语音生成

浏览 设计 下与 语音生成 相关的 Agent Skill,并比较相近工作流、工具与使用场景。

5 个技能
N
tts

作者 NoizAI

tts 技能可将文本转换为语音音频,适用于旁白、配音、配音解说和按时间轴对齐的播放。你可以用它把纯文本生成语音文件,将文章或文本文件转成语音,或生成带时间控制的 SRT 驱动音频。它支持简单模式和时间轴模式,也支持面向后端的工作流,便于重复、稳定地使用 tts。

语音生成
收藏 0GitHub 498
N
sound-fx

作者 NoizAI

使用 sound-fx 技能,把文本提示词转换成音效、拟音、环境底噪、怪物声音和 UI 音效。它适合用于音效编辑、快速原型验证和可下载音频素材制作。先通过 NoizAI/skills 安装,然后使用基于脚本的工作流,并准备有效的 Noiz API key。它不适用于语音、歌词、旋律或声音克隆。

音频编辑
收藏 0GitHub 498
N
characteristic-voice

作者 NoizAI

characteristic-voice 是一款用于生成温暖、像陪伴者一样、带有情感在场感的语音技能。适合安抚式回复、早安晚安消息、轻松闲聊,以及带停顿、笑声或温柔感的角色化表达。它包含基于预设的工作流和后端支持,便于实际使用 characteristic-voice。

语音生成
收藏 0GitHub 498
N
chat-with-anyone

作者 NoizAI

chat-with-anyone 可从公开音频克隆真实人物的声音,或根据图片设计匹配的声音,再通过 TTS 生成合成回复。它支持角色扮演、旁白和语音生成等实用工作流,并提供安装、素材选择和安全使用方面的指导。

语音生成
收藏 0GitHub 498
O
speech

作者 openai

使用 speech 技能将文本转换为可朗读的音频,适用于旁白、配音、IVR 提示、无障碍朗读和批量语音生成。它基于 OpenAI Audio API,内置 voices,附带 CLI,并在实际运行时需要 `OPENAI_API_KEY`。不支持自定义 voice 创建。

设计实现
收藏 0GitHub 0
语音生成 Agent Skill