O
transcribe
作者 openai
transcribe 可將音訊或影片轉成文字,並支援選用的聲紋分群與已知說話者提示。它特別適合技術寫作、會議紀錄、訪談、講座與內容營運;當你需要可重複使用、輸出格式清楚、且比通用提示詞更少猜測的 transcribe 技能時,這是一個相當合適的選擇。
技术写作
收藏 0GitHub 18.8k
作者 openai
transcribe 可將音訊或影片轉成文字,並支援選用的聲紋分群與已知說話者提示。它特別適合技術寫作、會議紀錄、訪談、講座與內容營運;當你需要可重複使用、輸出格式清楚、且比通用提示詞更少猜測的 transcribe 技能時,這是一個相當合適的選擇。
作者 microsoft
azure-speech-to-text-rest-py 是一個 Python 版 Azure Speech REST 技能,適合在不使用 Speech SDK 的情況下進行短音訊轉錄。當你需要直接掌控 HTTP、快速完成設定,且要支援最長 60 秒的音訊檔時,這個技能特別適合後端開發。這份指南涵蓋安裝、驗證、音訊格式,以及何時應避免用在長音訊、串流或批次轉錄情境。
作者 mukul975
detecting-deepfake-audio-in-vishing-attacks 可協助資安團隊分析 vishing、詐騙與冒充案件中的音訊,判斷是否含有 AI 生成語音。它會擷取頻譜與 MFCC 特徵、對可疑樣本進行評分,並產出適合檢視的鑑識式報告。很適合安全稽核與事件應變流程使用。