作成者 affaan-m
videodb は、ローカルファイル、URL、RTSP/RTMP のライブ配信、またはデスクトップキャプチャから動画と音声を取り込み、タイムスタンプ付きの検索で該当シーンを見つけ、再生可能な証拠として確認し、クリップ、オーバーレイ、文字起こし、アラート、タイムライン編集で実際に操作するのに役立ちます。VideoDB for Video Editing とライブ配信分析に向けた、実用的な videodb ガイドです。
作成者 affaan-m
videodb は、ローカルファイル、URL、RTSP/RTMP のライブ配信、またはデスクトップキャプチャから動画と音声を取り込み、タイムスタンプ付きの検索で該当シーンを見つけ、再生可能な証拠として確認し、クリップ、オーバーレイ、文字起こし、アラート、タイムライン編集で実際に操作するのに役立ちます。VideoDB for Video Editing とライブ配信分析に向けた、実用的な videodb ガイドです。
作成者 affaan-m
video-editingスキルは、既存の映像素材をより洗練された、各プラットフォーム向けの動画へ素早く仕上げるためのものです。Vlog、チュートリアル、デモ、短尺クリップ、インタビュー編集を対象に、カット、構成、字幕付け、リフレーミング、軽い補強を中心に扱います。すでにラフ素材があり、実用的なvideo-editingガイドが必要なときに最適です。
作成者 affaan-m
fal-ai-media は、fal.ai MCP を使ってメディア生成を一元化する GitHub スキルです。画像生成、画像編集、動画、音声、オーディオの各ワークフローで、モデル検索、コスト確認、ガイド付きプロンプトを使いながら fal-ai-media スキルをインストールして活用できます。
作成者 openai
transcribe は、音声や動画をテキスト化するスキルで、話者分離の指定や既知話者のヒントも使えます。技術文書作成、会議メモ、インタビュー、講義、コンテンツ運用など、出力形式を安定させたい場面に向いています。汎用プロンプトよりも手順が明確で、再現性のある音声文字起こしスキルを求めるときに適しています。
作成者 JimLiu
baoyu-youtube-transcriptは、YouTubeのURLまたは動画IDから文字起こし、字幕、カバー画像を抽出できるスキルです。言語指定、翻訳、Markdown / SRT出力、キャッシュを使った再整形に対応し、より確実に文字起こしを取得するためにInnerTube APIからyt-dlpへのフォールバックも備えています。
作成者 heygen-com
hyperframes は、HyperFrames で HTML ベースの動画コンポジションを構築するためのワークフロースキルです。タイトルカード、オーバーレイ、字幕、ナレーション、音に反応するモーション、シーン遷移など、Video Editing 向けに構造化されたコードファーストの hyperframes が必要なときに使えます。汎用的なプロンプトだけの動画依頼よりも、レイアウト、タイミング、アニメーションの設計を重視します。
作成者 microsoft
azure-ai-voicelive-ts は、Azure AI Voice Live TypeScript SDK を使ってリアルタイム音声 AI アプリを構築するのに役立ちます。双方向音声、ストリーミング応答、セッション設定、関数呼び出しが必要な Node.js やブラウザ向けプロジェクトに最適です。この azure-ai-voicelive-ts ガイドは、実践的な導入、使い方、コード生成のヒントを探しているときに役立ちます。
作成者 microsoft
azure-ai-contentunderstanding-py は、Azure AI Content Understanding 向けの Python スキルです。ドキュメント、画像、音声、動画から構造化コンテンツを抽出し、RAG ワークフローや自動化に活用できます。信頼性の高いマルチモーダル抽出、Azure 認証、再現性のあるパイプライン向け出力が必要な場合に適しています。
作成者 microsoft
azure-ai-voicelive-java は、Java のバックエンド開発向けの Azure AI VoiceLive SDK スキルです。インストール、認証、WebSocket による音声ストリーミング、イベント処理、リアルタイムのアシスタント構築に役立つ実例ベースの使い方をカバーします。
作成者 microsoft
azure-ai-voicelive-dotnet は、Azure AI Voice Live を使ってリアルタイム音声AIアプリを構築するための .NET 向けスキルです。インストール、セットアップ、認証、利用方法をカバーしており、双方向音声、低遅延セッション、音声対話から音声対話へのワークフローなど、バックエンド開発に必要なガイダンスを提供します。
作成者 microsoft
podcast-generation は、Azure OpenAI GPT Realtime Mini を WebSocket で使い、テキストから AI 生成のポッドキャスト風音声を作るためのスキルです。React、Python FastAPI、PCM ストリーミング、文字起こしの取得、WAV 変換まで含めた、Full-Stack Development 向けの podcast-generation に適しています。汎用的なプロンプトではなく、実際のアプリ統合に使える実践的な podcast-generation ガイドが必要なときに向いています。
作成者 microsoft
github-issue-creator は、メモ、エラーログ、音声入力、スクリーンショットを、GitHub らしい簡潔な issue 下書きに整えます。Issue Tracking 用のこの github-issue-creator skill は、要約、環境、再現手順、期待される挙動と実際の挙動、影響範囲、証拠を整理し、レビューしやすい markdown issue にまとめるのに役立ちます。
作成者 pexoai
seedance-2.0-prompterは、マルチモーダルなSeedance 2.0アセットを、役割が明確で `@asset` 構文に対応した構造化プロンプトへ整理し、導入・設定・実運用に使いやすい再利用可能なテンプレートとして活用できるようにします。
作成者 rameerez
transcribe-video skill は、AWS Transcribe を使って動画や音声ファイルを .srt、.vtt、.txt に変換します。字幕、検索可能な文字起こし、または話し言葉をすっきりしたテキストにしたいときの transcribe-video の用途に向いています。Format Conversion ワークフローで transcribe-video を使う場合にも適しています。
作成者 mukul975
detecting-deepfake-audio-in-vishing-attacks は、セキュリティチームが vishing、詐欺、なりすまし事案における AI 生成音声を分析するのに役立ちます。スペクトル特徴と MFCC ベースの特徴を抽出し、疑わしいサンプルにスコアを付け、レビュー用のフォレンジック形式レポートを出力します。Security Audit やインシデント対応のワークフローに適しています。
作成者 openai
speech skillを使うと、テキストを音声に変換して、ナレーション、ボイスオーバー、IVRプロンプト、アクセシビリティ向け読み上げ、バッチ音声生成に活用できます。OpenAI Audio API、組み込み音声、同梱のCLI、そしてライブ実行用の`OPENAI_API_KEY`を使用します。カスタム音声の作成は対象外です。
作成者 microsoft
azure-ai-voicelive-py は、Azure AI Voice Live を使って Python でリアルタイム音声AIアプリを構築するためのスキルです。双方向の WebSocket 音声、音声アシスタント、音声対話、文字起こし、アバター、ツール利用型の音声エージェントに適しています。非同期接続、Azure 認証、セッション制御、低遅延ストリーミングが必要なバックエンド開発に特に向いています。
作成者 microsoft
azure-ai-transcription-py は、Azure AI Transcription 向けの Python スキルです。タイムスタンプと話者分離付きのバッチ音声認識やリアルタイム音声認識に使えます。バックエンド開発に向いており、サブスクリプションキー認証を採用。Azure クライアントライブラリの適切なインストール手順と使い方の流れを確認できます。