作者 openai
transcribe 可将音频或视频转成文本,并支持可选的说话人分离和已知说话人提示。它很适合技术写作、会议纪要、访谈、讲座和内容运营等场景,尤其是在你需要一个可重复使用、输出格式清晰、比通用提示词更少猜测的 transcribe 技能时。
作者 openai
transcribe 可将音频或视频转成文本,并支持可选的说话人分离和已知说话人提示。它很适合技术写作、会议纪要、访谈、讲座和内容运营等场景,尤其是在你需要一个可重复使用、输出格式清晰、比通用提示词更少猜测的 transcribe 技能时。
作者 NoizAI
speech-to-text 技能可将受支持的音频文件转写为纯文本,并支持时间戳、说话人标签和 JSON 输出。它面向需要稳定、可重复流程的实际 speech-to-text 场景,适用于访谈、会议、播客、讲座,以及对转写一致性要求较高的自动化任务。
作者 NoizAI
tts 技能可将文本转换为语音音频,适用于旁白、配音、配音解说和按时间轴对齐的播放。你可以用它把纯文本生成语音文件,将文章或文本文件转成语音,或生成带时间控制的 SRT 驱动音频。它支持简单模式和时间轴模式,也支持面向后端的工作流,便于重复、稳定地使用 tts。
作者 BrianRWagner
youtube-summarizer 能把 YouTube 链接转成结构化的转录摘要,包含关键洞见、元数据,以及可选的章节级拆解。适合快速汇报、研究笔记,以及把长视频改写成便于检索的要点。可查看 youtube-summarizer install、youtube-summarizer usage 和 youtube-summarizer guide,了解 Summarization 工作流。
作者 rameerez
transcribe-video 技能可使用 AWS Transcribe 将视频或音频文件转换为 .srt、.vtt 和 .txt 输出。适合需要字幕、可检索转写稿,或将口语内容整理为干净文本版本的 transcribe-video 场景。它也适用于 transcribe-video 的 Format Conversion 工作流。
作者 K-Dense-AI
markitdown 可将文件和办公文档转换为 Markdown,便于阅读、分块、检索和 LLM 工作流。这个 markitdown 技能支持 PDF、DOCX、PPTX、XLSX、HTML、CSV、JSON、XML、ZIP、EPUB、带 OCR 的图片以及音频转写,是一份实用的 markitdown 格式转换指南。