Audio

Entdecke Agent Skills mit dem Tag Audio und vergleiche verwandte Workflows im Verzeichnis.

16 skills
R
remotion-best-practices

by remotion-dev

Praktische Remotion Best Practices für den Aufbau programmatischer Videos, Animationen und audiogesteuerter Kompositionen in React.

Video Editing
Favorites 0GitHub 2411
I
elevenlabs-voice-isolator

by inferen-sh

CLI-basierter ElevenLabs Voice Isolator Skill zum Entfernen von Hintergrundgeräuschen und zum Isolieren von Stimmen/Vocals aus Audio über inference.sh. Ideal für Podcast-Optimierung, Interviews, Gesangsspuren, laute Aufnahmen und Audiorestaurierungs-Workflows.

Audio Editing
Favorites 0GitHub 232
I
ai-avatar-video

by inferen-sh

Erzeuge KI-Avatare und Talking-Head-Videos aus einem Bild und einem Audiotrack mit der inference.sh CLI. ai-avatar-video bündelt die Apps OmniHuman, Fabric und PixVerse Lipsync für audio-gesteuerte Avatare, Lipsync-Videos und virtuelle Presenter – ideal für Marketing, Erklärvideos und Social-Content-Workflows.

Video Editing
Favorites 0GitHub 0
I
ai-content-pipeline

by inferen-sh

Entwerfen und betreiben Sie mehrstufige AI-Content-Pipelines, die Bild-, Video-, Audio- und Text-Tools über die inference.sh CLI miteinander verketten. Verwenden Sie ai-content-pipeline, um Workflows zu automatisieren wie: ein Bild generieren, zu einem Video animieren, Sound oder Voiceover hinzufügen und Inhalte für YouTube, Social Media und Marketing-Kampagnen aufbereiten.

Workflow Automation
Favorites 0GitHub 0
I
ai-music-generation

by inferen-sh

Erzeuge KI-Musik und komplette Songs aus Text-Prompts mit ElevenLabs Music, Diffrythm und Tencent Song Generation über die inference.sh CLI. Ideal für Hintergrundmusik, Soundtracks, Social-Clips, Podcasts und lizenzgebührenfreie Musik. Unterstützt schnelle Song-Generierung, Instrumentals und komplette Vocal-Songs.

Voice Generation
Favorites 0GitHub 0
I
ai-podcast-creation

by inferen-sh

Erstellen Sie KI-gestützte Podcasts und Sprachinhalte aus Text mit Kokoro TTS, DIA TTS und der inference.sh CLI. Kombinieren Sie mehrere Stimmen, fügen Sie Musik hinzu und bauen Sie komplette Episoden für Podcasts, Hörbücher und Audio-Newsletter.

Voice Generation
Favorites 0GitHub 0
I
ai-social-media-content

by inferen-sh

KI-gestützter Social-Media-Content-Generator für TikTok, Instagram, YouTube und X. Verwende die inference.sh CLI, um mit Modellen wie FLUX, Veo, Seedance, Wan, Kokoro TTS und Claude plattformspezifische Videos, Reels, Shorts, Thumbnails, Bilder, Captions und Hashtags zu erstellen.

Social Media
Favorites 0GitHub 0
I
ai-voice-cloning

by inferen-sh

ai-voice-cloning ist ein auf inference.sh basierendes Skill für KI-Sprachgenerierung, Text-to-Speech und Voice Cloning über die CLI. Es bündelt ElevenLabs-, Kokoro TTS-, DIA-, Chatterbox-, Higgs- und VibeVoice-Modelle für natürliche Sprache, mehrstimmige Vertonung und Stimmtransformation in Audio- und Videoprojekten.

Voice Generation
Favorites 0GitHub 0
I
dialogue-audio

by inferen-sh

Erzeuge realistisch klingende Dialog-Audios mit mehreren Sprecher:innen mit Dia TTS und ElevenLabs über die inference.sh CLI. Das dialogue-audio Skill hilft dir, Sprecherrollen, Emotion, Tempo und Gesprächsverlauf für Podcasts, Hörbücher, Erklärvideos, Charakterszenen und andere dialogbasierte Inhalte präzise zu steuern.

Voice Generation
Favorites 0GitHub 0
I
elevenlabs-dialogue

by inferen-sh

Erzeuge mit ElevenLabs über die inference.sh CLI hochwertiges, mehrstimmiges Dialog-Audio. Verwandle strukturierte Skripte in natürlich klingende Gespräche mit mehreren Stimmen in einer einzigen Datei – ideal für Podcasts, Hörbücher, Erklärvideos, Tutorials, Charakterdialoge und Videoskripte.

Voice Generation
Favorites 0GitHub 0
I
elevenlabs-dubbing

by inferen-sh

elevenlabs-dubbing ermöglicht es dir, Audio- oder Videoinhalte automatisch in 29 Sprachen zu vertonen und zu übersetzen – direkt über die inference.sh CLI – und dabei die Stimmen der ursprünglichen Sprecher zu erhalten. Ideal für Video-Editoren, Podcaster und Lokalisierungsteams, die schnell hochwertige, mehrsprachige Versionen bestehender Inhalte benötigen.

Video Editing
Favorites 0GitHub 0
I
elevenlabs-music

by inferen-sh

Erzeuge originale KI-Musik aus Textprompts mit der inference.sh CLI und ElevenLabs. Steuere Länge, Stil und Stimmung, um direkt aus deinem Terminal lizenzfreie Hintergrundmusik, Soundtracks, Jingles, Podcast-Betten und Game-Audio zu erstellen.

Audio Editing
Favorites 0GitHub 0
I
elevenlabs-sound-effects

by inferen-sh

Erzeuge KI-Soundeffekte aus Text-Prompts mit ElevenLabs über die inference.sh CLI. Ideal für Video-Editoren, Game-Developer, Podcaster, Filmschaffende und Content Creator, die schnelles, lizenzfreies Sounddesign benötigen. Unterstützt Text-to-Sound-Effect, anpassbare Dauer und Prompt-Steuerung für cinematische, atmosphärische und game-taugliche SFX.

Audio Editing
Favorites 0GitHub 0
I
elevenlabs-stt

by inferen-sh

Hochpräzise ElevenLabs Speech-to-Text über die inference.sh CLI mit Scribe v1/v2 Modellen. Unterstützt Transkription, Sprecher-Diarisierung, Audio-Event-Tagging, Wortzeitstempel, Forced Alignment und Untertitel-Generierung für Meetings, Podcasts und andere Audio-Workflows.

Audio Editing
Favorites 0GitHub 0
I
elevenlabs-tts

by inferen-sh

ElevenLabs Text-to-Speech über die inference.sh CLI, mit über 22 Premiumstimmen, Mehrsprachenunterstützung und schnellen Modelloptionen für produktive Voice-Generation-Workflows.

Voice Generation
Favorites 0GitHub 0
I
elevenlabs-voice-changer

by inferen-sh

ElevenLabs voice changer Skill, der die inference.sh CLI (infsh) nutzt, um aufgezeichnete Sprache in eine andere synthetische Stimme umzuwandeln und dabei Inhalt und Emotion zu erhalten. Unterstützt eleven_multilingual_sts_v2 (70+ Sprachen) und eleven_english_sts_v2 für Speech-to-Speech, Akzentwechsel und Stimmverschleierung in Content-Produktion, Dubbing und Charakterstimmen.

Voice Generation
Favorites 0GitHub 0