Speech To Text

Speech To Text skills and workflows surfaced by the site skill importer.

5 skills
O
transcribe

par openai

transcribe transforme l’audio ou la vidéo en texte, avec en option la diarisation et des indications sur les locuteurs connus. C’est particulièrement adapté à la rédaction technique, aux comptes rendus de réunion, aux entretiens, aux cours et aux opérations de contenu lorsqu’il faut un skill de transcription reproductible, avec des formats de sortie clairs et moins d’approximations qu’avec un prompt générique.

Technical Writing
Favoris 0GitHub 18.8k
M
azure-speech-to-text-rest-py

par microsoft

azure-speech-to-text-rest-py est un skill Python Azure Speech REST pour transcrire rapidement de courts fichiers audio sans passer par le Speech SDK. Il convient au développement backend lorsque vous avez besoin d’un contrôle HTTP direct, d’une mise en route rapide et d’une prise en charge des fichiers audio jusqu’à 60 secondes. Ce guide couvre l’installation, l’authentification, le format audio et les cas où il vaut mieux éviter les longs fichiers audio, le streaming ou la transcription par lots.

Backend Development
Favoris 0GitHub 2.3k
N
speech-to-text

par NoizAI

La skill speech-to-text transcrit les fichiers audio pris en charge en texte brut, avec des options pour les horodatages, les identifiants de locuteurs et la sortie JSON. Elle est conçue pour un usage pratique de la transcription speech-to-text dans des workflows reproductibles, notamment pour les interviews, réunions, podcasts, cours et tâches d’automatisation où la régularité de la transcription compte.

Workflow Automation
Favoris 0GitHub 498
N
tts

par NoizAI

Le skill tts transforme du texte en audio parlé pour la narration, le doublage, la voix off et la lecture synchronisée à une timeline. Utilisez-le pour générer un fichier vocal à partir d’un texte simple, convertir des articles ou des fichiers texte en parole, ou produire un audio piloté par SRT avec contrôle du timing. Il prend en charge des modes simple et timeline, ainsi que des workflows adaptés au backend pour un usage tts reproductible.

Voice Generation
Favoris 0GitHub 498
M
detecting-deepfake-audio-in-vishing-attacks

par mukul975

detecting-deepfake-audio-in-vishing-attacks aide les équipes de sécurité à analyser l’audio pour repérer la parole générée par IA dans des cas de vishing, de fraude et d’usurpation d’identité. Il extrait des caractéristiques spectrales et basées sur les MFCC, attribue un score aux échantillons suspects et produit un rapport de type forensique pour examen. Idéal pour les workflows d’audit de sécurité et de réponse à incident.

Security Audit
Favoris 0GitHub 0
Speech To Text