Speech To Text

Speech To Text skills and workflows surfaced by the site skill importer.

5 개 스킬

transcribe

작성자 openai

transcribe는 오디오나 비디오를 텍스트로 바꾸며, 선택적으로 화자 분리와 알려진 화자 힌트도 지원합니다. Technical Writing, 회의록, 인터뷰, 강의, 콘텐츠 운영처럼 재현 가능한 transcribe 스킬과 명확한 출력 형식이 필요할 때 잘 맞으며, 범용 프롬프트보다 덜 추측에 의존하게 해줍니다.

Technical Writing

즐겨찾기 0GitHub 18.8k

azure-speech-to-text-rest-py

작성자 microsoft

azure-speech-to-text-rest-py는 Speech SDK 없이 짧은 오디오를 텍스트로 전환하는 Python용 Azure Speech REST 스킬입니다. 직접적인 HTTP 제어, 빠른 설정, 최대 60초 오디오 파일 지원이 필요한 백엔드 개발에 적합합니다. 이 가이드는 설치, 인증, 오디오 형식 지정, 그리고 긴 오디오·스트리밍·배치 전사를 피해야 하는 경우까지 다룹니다.

Backend Development

즐겨찾기 0GitHub 2.3k

speech-to-text

작성자 NoizAI

speech-to-text 스킬은 지원되는 오디오 파일을 일반 텍스트로 전사하며, 타임스탬프, 화자 레이블, JSON 출력 옵션을 제공합니다. 반복 가능한 워크플로에서 실용적으로 음성을 텍스트로 옮기는 용도에 맞게 설계되었으며, 인터뷰, 회의, 팟캐스트, 강의, 그리고 일관된 전사가 중요한 자동화 작업에 적합합니다.

Workflow Automation

즐겨찾기 0GitHub 498

tts

작성자 NoizAI

tts 스킬은 텍스트를 음성 오디오로 바꿔 내레이션, 더빙, 보이스오버, 타임라인 맞춤 재생에 활용할 수 있습니다. 일반 텍스트로 음성 파일을 만들고, 기사나 텍스트 파일을 음성으로 변환하고, 시간 제어가 필요한 SRT 기반 오디오를 렌더링하는 데 유용합니다. 단순 모드와 타임라인 모드를 모두 지원하며, 반복 가능한 tts 사용을 위한 백엔드 인식 워크플로도 제공합니다.

Voice Generation

즐겨찾기 0GitHub 498

detecting-deepfake-audio-in-vishing-attacks

작성자 mukul975

detecting-deepfake-audio-in-vishing-attacks는 보안 팀이 vishing, 사기, 사칭 사례에서 AI 생성 음성을 분석하는 데 도움을 줍니다. 스펙트럼 및 MFCC 기반 특징을 추출하고, 의심스러운 샘플에 점수를 매기며, 검토용 포렌식 스타일 보고서를 생성합니다. Security Audit와 사고 대응 워크플로에 적합합니다.

Security Audit

즐겨찾기 0GitHub 0