O
transcribe
作成者 openai
transcribe は、音声や動画をテキスト化するスキルで、話者分離の指定や既知話者のヒントも使えます。技術文書作成、会議メモ、インタビュー、講義、コンテンツ運用など、出力形式を安定させたい場面に向いています。汎用プロンプトよりも手順が明確で、再現性のある音声文字起こしスキルを求めるときに適しています。
Technical Writing
お気に入り 0GitHub 18.8k
作成者 openai
transcribe は、音声や動画をテキスト化するスキルで、話者分離の指定や既知話者のヒントも使えます。技術文書作成、会議メモ、インタビュー、講義、コンテンツ運用など、出力形式を安定させたい場面に向いています。汎用プロンプトよりも手順が明確で、再現性のある音声文字起こしスキルを求めるときに適しています。
作成者 microsoft
azure-speech-to-text-rest-py は、Speech SDK を使わずに短い音声を文字起こしするための Python 向け Azure Speech REST skill です。HTTP を直接制御したいバックエンド開発、素早く立ち上げたいケース、60 秒までの音声ファイル対応が必要な場合に向いています。このガイドでは、インストール、認証、音声フォーマット、そして長尺音声・ストリーミング・バッチ文字起こしを避けるべき場面までをカバーします。
作成者 mukul975
detecting-deepfake-audio-in-vishing-attacks は、セキュリティチームが vishing、詐欺、なりすまし事案における AI 生成音声を分析するのに役立ちます。スペクトル特徴と MFCC ベースの特徴を抽出し、疑わしいサンプルにスコアを付け、レビュー用のフォレンジック形式レポートを出力します。Security Audit やインシデント対応のワークフローに適しています。