Voice Generation

Entdecke Voice Generation Agent Skills in Design und vergleiche verwandte Workflows, Tools und Einsatzfaelle.

5 Skills

tts

von NoizAI

Die tts-Skill wandelt Text in Sprachaudio um – für Erzählungen, Synchronisation, Voiceover und zeitlich abgestimmte Wiedergabe. Sie eignet sich, um aus reinem Text eine Sprachdatei zu erzeugen, Artikel oder Textdateien in Sprache zu konvertieren oder SRT-gesteuertes Audio mit Timing-Kontrolle zu rendern. Unterstützt werden ein einfacher Modus und ein Timeline-Modus sowie backend-bewusste Workflows für wiederholbare tts-Nutzung.

Voice Generation

Favoriten 0GitHub 498

sound-fx

von NoizAI

Nutze die sound-fx-Skill, um Textprompts in Soundeffekte, Foley, Ambient-Betten, Kreaturengeräusche und UI-Geräusche umzuwandeln. Sie eignet sich für Audio Editing mit sound-fx, schnelles Prototyping und herunterladbare Audio-Assets. Installation über NoizAI/skills, anschließend der skriptbasierte Workflow mit einem gültigen Noiz API-Schlüssel. Nicht für Sprache, Lyrics, Melodien oder Voice Cloning.

Audio Editing

Favoriten 0GitHub 498

characteristic-voice

von NoizAI

characteristic-voice ist ein Voice-Generation-Skill für warme, begleitende und emotional präsente Sprache. Verwende ihn für tröstende Antworten, Morgen- oder Nachtbotschaften, lockeren Schlagabtausch und charakterorientierte Wiedergabe mit Pausen, Lachen oder Zärtlichkeit. Er bietet einen preset-gesteuerten Workflow sowie Backend-Unterstützung für den praktischen Einsatz von characteristic-voice.

Voice Generation

Favoriten 0GitHub 498

chat-with-anyone

von NoizAI

chat-with-anyone hilft dir, die Stimme einer echten Person aus öffentlichem Audio zu klonen oder aus einem Bild eine passende Stimme zu entwerfen und anschließend mit TTS synthetische Antworten zu erzeugen. Der Skill unterstützt praxisnahe Workflows für Rollenspiel, Narration und Stimmgenerierung und bietet Hinweise zu Installation, Quellenauswahl und sicherer Nutzung.

Voice Generation

Favoriten 0GitHub 498

speech

von openai

Nutze die speech-Skill, um Text in gesprochene Audiodateien für Erzählungen, Voiceovers, IVR-Ansagen, barrierefreie Vorlesefunktionen und die Stapelgenerierung von Sprache umzuwandeln. Sie verwendet die OpenAI Audio API mit integrierten Stimmen, eine mitgelieferte CLI und `OPENAI_API_KEY` für Live-Ausführungen. Die Erstellung eigener Stimmen ist nicht abgedeckt.

Design Implementation

Favoriten 0GitHub 0