Speech To Text

Speech To Text skills and workflows surfaced by the site skill importer.

5 skills

transcribe

por openai

transcribe convierte audio o video en texto con diarización opcional y pistas de hablantes conocidos. Encaja muy bien para redacción técnica, notas de reuniones, entrevistas, clases y operaciones de contenido cuando necesitas una skill de transcripción repetible, con formatos de salida claros y menos improvisación que con un prompt genérico.

Technical Writing

Favoritos 0GitHub 18.8k

azure-speech-to-text-rest-py

por microsoft

azure-speech-to-text-rest-py es una skill de REST de Azure Speech en Python para transcribir audio corto sin usar Speech SDK. Úsala en desarrollo backend cuando necesites control HTTP directo, una configuración rápida y compatibilidad con archivos de audio de hasta 60 segundos. La guía cubre la instalación, la autenticación, el formato de audio y cuándo evitar audio largo, streaming o la transcripción por lotes.

Backend Development

Favoritos 0GitHub 2.3k

speech-to-text

por NoizAI

La skill de speech-to-text transcribe archivos de audio compatibles a texto plano, con opciones de marcas de tiempo, etiquetas de hablantes y salida JSON. Está pensada para un uso práctico de speech-to-text en flujos de trabajo repetibles, como entrevistas, reuniones, pódcast, clases y tareas de automatización donde importa mantener una transcripción consistente.

Workflow Automation

Favoritos 0GitHub 498

tts

por NoizAI

La skill de tts convierte texto en audio hablado para narración, doblaje, locución y reproducción alineada a una línea de tiempo. Úsala para generar un archivo de voz a partir de texto plano, convertir artículos o archivos de texto en voz, o renderizar audio a partir de SRT con control de tiempos. Admite modos simple y de línea de tiempo, además de flujos de trabajo conscientes del backend para un uso repetible de tts.

Voice Generation

Favoritos 0GitHub 498

detecting-deepfake-audio-in-vishing-attacks

por mukul975

detecting-deepfake-audio-in-vishing-attacks ayuda a los equipos de seguridad a analizar audio en busca de voz generada por IA en casos de vishing, fraude y suplantación de identidad. Extrae características espectrales y basadas en MFCC, puntúa muestras sospechosas y genera un informe de estilo forense para su revisión. Es ideal para flujos de trabajo de auditoría de seguridad y respuesta a incidentes.

Security Audit

Favoritos 0GitHub 0