transcribe-video

作成者 rameerez

transcribe-video skill は、AWS Transcribe を使って動画や音声ファイルを .srt、.vtt、.txt に変換します。字幕、検索可能な文字起こし、または話し言葉をすっきりしたテキストにしたいときの transcribe-video の用途に向いています。Format Conversion ワークフローで transcribe-video を使う場合にも適しています。

スター23

お気に入り0

追加日2026年5月9日

カテゴリーFormat Conversion

インストールコマンド

npx skills add rameerez/claude-code-startup-skills --skill transcribe-video

編集スコア

この skill は 78/100 の評価で、ディレクトリ利用者にとって有力な掲載候補です。AWS Transcribe を使って動画や音声を SRT/VTT とプレーンテキストに変換する、明確で実用的なワークフローがあり、導入判断もしやすい部類です。ただし、`ffmpeg`、AWS CLI、AWS 権限の設定が必要なため、一定のセットアップ負荷は見込んでください。

78/100

強み

トリガーと出力仕様が明確で、動画または音声ファイルのパスを、任意の言語コード付きで指定すると .srt、.vtt、.txt を生成する。
運用フローが具体的で、前提条件、音声抽出、一時的な S3 アップロード、AWS Transcribe ジョブ、結果のダウンロード、後片付けまで説明されている。
リポジトリ内容の情報量が十分で、正しい frontmatter、本文、コードフェンス、ファイル参照が揃っているため、汎用プロンプトよりも推測が少ない。

注意点

`ffmpeg`、AWS CLI、`s3:*` と `transcribe:*` の権限が必須で、外部セットアップと認証情報の準備が必要。
インストールコマンドや補助スクリプト、関連リソースは用意されていないため、記載された手順を手動で進める必要がある。

Aws Ffmpeg Transcription Video Audio

概要

transcribe-video スキルの概要

transcribe-video でできること

transcribe-video スキルは、AWS Transcribe を使って動画または音声ファイルを .srt、.vtt、.txt に変換します。手作業で文字起こしをしなくても、字幕、検索可能な書き起こし、または話し言葉をきれいなテキストとして残したいときに特に便利です。すでに AWS を使うワークフローがあるなら、transcribe-video スキルは再現性のあるファイルベースの文字起こし処理として相性が良いでしょう。

どんな人に向いているか

録画済みの会議、インタビュー、ウェビナー、デモ、講座動画を扱い、制作の流れに追いつく速度で書き起こしが必要な人に向いています。単なるテキスト化ではなく、字幕形式を重視する人には特に有用です。transcribe-video for Format Conversion が必要なら、元のメディアを字幕・書き起こし用アーティファクトへ変換し、後工程で再利用しやすくするのに役立ちます。

把握しておきたい主なトレードオフ

最大の利点は、ワークフローが具体的なことです。音声を抽出し、アップロードし、文字起こしジョブを実行し、リソースを片付ける――この流れが明確なので、曖昧な「これを文字起こしして」という依頼より運用に乗せやすくなります。一方で、依存関係の負担は大きめです。ffmpeg、AWS CLI、そして有効な AWS 権限が必要になります。これらがすでに揃っていない場合、単発用途では導入とセットアップのコストがメリットを上回ることがあります。

transcribe-video スキルの使い方

インストールと事前確認

transcribe-video install を行うには、npx skills add rameerez/claude-code-startup-skills --skill transcribe-video でスキルを追加します。実行前に、ffmpeg と aws がインストール済みで、aws configure に有効な認証情報が設定されていることを確認してください。このスキルは S3 バケットの作成・削除と Transcribe ジョブの開始・削除も必要とするため、権限を厳しく制限した AWS アカウントでは、コマンド自体が正しく見えても失敗することがあります。

スキルに使える入力を渡す

このスキルはメディアファイルのパスと、必要に応じて en-US や es-ES のような言語コードを想定しています。弱い依頼は「この動画を書き起こして」です。より強い依頼は transcribe-video /path/to/demo.mp4 en-US、または「/work/interview.mp4 を英語で SRT、VTT、TXT に変換し、最後に一時 AWS リソースを削除して」です。言語が分かっているなら明示してください。ファイルがノイズを含む、長い、複数話者がいる、といった条件も精度に強く影響するため、コマンドの書き方より先に伝えておくのが重要です。

推奨ワークフロー

まず SKILL.md を読み、ローカル環境で参照されているリポジトリ内のファイルパスを確認してください。特に README.md、AGENTS.md、metadata.json、そして存在するなら rules/、resources/、references/ フォルダを見ておくとよいでしょう。このリポジトリは意図的にコンパクトですが、本当に価値があるのは処理の流れを理解することです。つまり、音声抽出、一時的な S3 へのアップロード、Transcribe ジョブの実行、出力のダウンロード、クリーンアップです。この順序が重要なのは、失敗しやすいのが文字起こしそのものより、権限、ファイル名、後片付けだからです。

出力品質を上げるコツ

できるだけ音質の良い元ファイルを使ってください。動画に複数の音声ストリームがある、圧縮が強い、BGM が入っている場合は、文字起こし前にその問題を解消するのが先です。スキルを呼び出すときは、ベースファイル名を維持したい、字幕形式とプレーンテキストの両方が欲しい、編集用の読みやすい本文が必要、といったように、ファイル名や出力要件を具体的に書くのがおすすめです。transcribe-video usage を予測しやすくしたいなら、言語コード、出力先、そして字幕向けか読解向けかを明示してください。

transcribe-video スキル FAQ

汎用プロンプトより優れている？

再現性のある文字起こしワークフローが欲しいなら、たいていははいです。汎用プロンプトでも書き起こし自体は依頼できますが、AWS Transcribe のセットアップ、音声抽出、一時バケットの作成、クリーンアップまでを安定して扱うことはできません。transcribe-video スキルは、ファイル、形式、運用上の дисциплина が必要な仕事でより価値を発揮します。

使うのに AWS は必要？

はい。このスキルは AWS Transcribe と S3 に依存しているため、ローカル完結の文字起こしツールではありません。AWS 認証情報を使えない、あるいはクラウド権限を管理したくない場合は、おそらく適切なスキルではありません。その場合は、ローカルの音声認識ツールのほうが合っているかもしれません。

初心者でも使いやすい？

コマンドラインツールの導入や AWS 権限の付与に慣れているなら、初心者にも扱いやすいです。文字起こしの流れ自体はシンプルですが、初回利用の障壁はセットアップにあります。初心者は、リポジトリが想定しているファイルパスと言語コードのパターンをそのまま使い、変数は一度に 1 つだけ変える進め方がうまくいきやすいです。

どんなときに transcribe-video を使うべきではない？

AWS がまだ設定されていないのに、短くて使い捨ての作業だけをしたい場合には向きません。また、オフライン処理、独自の話者分離ロジック、あるいは単純な書き起こし以上の編集的な整形が必要な場合も避けたほうがいいでしょう。目的が話し言葉の要約だけなら、このスキルは必要以上にインフラ寄りです。

transcribe-video スキルを改善する方法

元データの文脈をもっと具体的に伝える

最良の結果を得るには、そのファイルが何で、出力で何を最も重視するのかを伝えるのが効果的です。たとえば「これは 42 分の製品デモで、話者は 1 人、音声は明瞭です。正確な英語字幕と読みやすい書き起こしを生成してください」という指定です。単にパスだけを渡すより、言語、書式、起こりやすい失敗点の優先順位を決めやすくなります。

避けられる文字起こしミスを減らす

音声が濁っている、音楽が混ざっている、騒がしい部屋で収録されている場合は、スキルを実行する前に元音声を改善してください。動画に複数言語が入っているなら、どの言語を文字起こししたいのかを明示します。目的が字幕なら、その旨をはっきり伝えましょう。そうすると、評価基準を生のテキスト精度だけでなく、タイミングや読みやすさにも置けます。こうした情報は、抽象的に「もっと高品質にして」と頼むよりもずっと重要です。

初回出力のあとに反復する

.srt、.vtt、.txt の出力は、それぞれ別々に確認してください。字幕は技術的には正しくても表示時間に対して長すぎることがあり、テキスト書き起こしは議事録やメモ用に句読点や話者整理が必要な場合があります。1 回目がかなり近い仕上がりなら、後処理で全部直そうとするより、より明確な言語コード、より良い音声ソース、またはより絞った出力目標で transcribe-video を再実行するほうが効果的です。

よくある失敗パターンに注意する

最も多い問題は、ffmpeg の未インストール、AWS CLI の設定ミス、IAM 権限不足、一時的な AWS リソースの消し忘れです。実行に失敗したら、まず前提条件、それから権限、最後に正確なファイルパスを確認してください。transcribe-video では、うまく動くかどうかはプロンプトの巧妙さよりも、有効なメディアファイル、適切な言語ヒント、そして最後までジョブを完了できる AWS 環境を用意できるかにかかっています。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

kreuzberg

作成者 kreuzberg-dev

このkreuzbergスキルは、PDF、Officeファイル、画像、HTML、メール、アーカイブなど91種類以上の形式に対応するKreuzbergの導入と活用を支援します。OCR、表、メタデータ、バッチ処理、実用的な解析の進め方まで、Python、Node.js/TypeScript、Rust、CLI の各ワークフローをカバーします。

PDF Processing

お気に入り 0GitHub 0

xlsx

作成者 anthropics

xlsx スキルは、成果物がスプレッドシートの場合に .xlsx、.xlsm、.csv、.tsv の読み取り・編集・修復・作成・変換を支援します。テンプレートを保った更新、数式を壊しにくいブック編集、乱れた表データの整形、pack・validation・recalculation 用スクリプトを使う実務的な運用に特に向いています。

Spreadsheet Workflows

お気に入り 0GitHub 105.1k

pdf

作成者 anthropics

pdfスキルは、PDF Processingにおけるテキスト抽出、結合・分割、ページの画像化、PDFフォーム処理を支援します。特に、入力可能フィールドの確認、フォームメタデータの抽出、入力不可フォームのレイアウト検証をスクリプトで進めたい場面に役立ちます。

PDF Processing

お気に入り 0GitHub 105.1k

baoyu-youtube-transcript

作成者 JimLiu

baoyu-youtube-transcriptは、YouTubeのURLまたは動画IDから文字起こし、字幕、カバー画像を抽出できるスキルです。言語指定、翻訳、Markdown / SRT出力、キャッシュを使った再整形に対応し、より確実に文字起こしを取得するためにInnerTube APIからyt-dlpへのフォールバックも備えています。

Format Conversion

お気に入り 0GitHub 13.2k

baoyu-url-to-markdown

作成者 JimLiu

baoyu-url-to-markdown は、vendored な baoyu-fetch CLI を使い、Chrome CDP・サイト別アダプター・汎用フォールバックで公開中の URL を Markdown に変換します。導入前に、Bun ランタイムの要件、初回の EXTEND.md 設定、X・YouTube・Hacker News・レンダリング後ページでの使い方を確認しておくと安心です。

Format Conversion

お気に入り 0GitHub 13.2k

minimax-xlsx

作成者 MiniMax-AI

minimax-xlsxは、Excel中心のワークフローでExcelブックの作成、読み取り、編集、検証、書式設定を行うための技能です。数式、スタイル、シート構成、ブックの挙動を保った構造化ファイルが必要なSpreadsheet Workflowsで使えます。.xlsx、.xlsm、.csv、.tsvのタスクに対応し、分析、新規ブック作成、最小限の変更、数式修復、検証までカバーします。minimax-xlsxのガイドは、単なる表ではなく、実運用で受け渡せるワークブック向けに設計されています。

Spreadsheet Workflows

お気に入り 0GitHub 0

baoyu-format-markdown

作成者 JimLiu

baoyu-format-markdown は、プレーンテキストや乱れた Markdown を、意味を保ったまま読みやすく公開しやすい Markdown に整形するスキルです。frontmatter、見出し、リスト、コードブロック、引用、CJK 向けのスペーシングを補正できるため、内容を書き換えずに Format Conversion を進めたい場面に向いています。

Format Conversion

お気に入り 0GitHub 13.2k

baoyu-danger-x-to-markdown

作成者 JimLiu

baoyu-danger-x-to-markdown は、X の投稿、スレッド、一部の記事を YAML front matter 付きの Markdown に変換します。`scripts/` 内のスクリプトを `bun` または `npx -y bun` で実行し、Cookie ベースのアクセスや同意フローにも対応。汎用的なプロンプトよりも、繰り返し使う Format Conversion ワークフローに適しています。

Format Conversion

お気に入り 0GitHub 13.2k

baoyu-markdown-to-html

作成者 JimLiu

baoyu-markdown-to-htmlは、MarkdownをWeChat風のスタイル付きHTMLに変換するスキルです。テーマ、コードハイライト、数式、PlantUML、脚注、画像処理、任意のリンク引用に対応し、`bun` または `npx -y bun` で実行できます。

Format Conversion

お気に入り 0GitHub 13.2k

nutrient-document-processing

作成者 affaan-m

Nutrient DWS API を使って PDF 処理とドキュメント自動化を行う nutrient-document-processing skill です。PDF、DOCX、XLSX、PPTX、HTML、画像などのファイルを変換、OCR、抽出、墨消し、署名、ウォーターマーク追加、入力できます。

PDF Processing

お気に入り 0GitHub 156.2k

pdf

作成者 openai

レイアウト、ページネーション、レンダリング結果が重要な PDF 処理タスクには、pdf スキルを使ってください。ページをレンダリングして結果を確認し、その後に調整するという、ビジュアル重視のワークフローで PDF を読み取り、作成、編集、レビューするのに役立ちます。信頼できる PDF の導入方法、pdf の使い方、文書の正確性を重視した実用的な pdf ガイドが必要なときに向いています。

PDF Processing

お気に入り 0GitHub 0

web-to-markdown

作成者 softaworks

web-to-markdown は、ローカルの `web2md` CLI を使って公開中の Web ページを整った Markdown に変換する Format Conversion スキルです。JS 描画ページ、対話操作が必要なフロー、複数 URL の一括変換にも対応し、Chromium 系ブラウザを利用します。実行されるのは、名前を明示して呼び出した場合のみです。

Format Conversion

お気に入り 0GitHub 1.3k

defuddle

作成者 kepano

defuddleは、Defuddle CLIでWebページからノイズの少ないMarkdownを抽出できるスキルです。調査、ドキュメント作成、記事執筆向けに、不要な要素を取り除いた本文を取得したい場面に向いています。通常のHTMLページで使い、npmでインストールしてください。.mdで終わるURLは対象外です。

Web Research

お気に入り 0GitHub 19.7k

json-canvas

作成者 kepano

json-canvas は、Obsidianスタイルのボード向けに有効な `.canvas` ファイルを作成・編集するためのスキルです。nodes、edges、IDs、座標、groups、references などを正しい構造で扱えます。

Diagramming

お気に入り 0GitHub 19.7k

read-file

作成者 duckdb

read-file は、DuckDB を使って CSV、JSON、Parquet、Avro、Excel、SQLite、空間データファイル、またはリモート URL を読み取り・確認するための skill です。行のプレビュー、スキーマ確認、データのプロファイリング、そして「このファイルに何が入っているか」の把握に使えます。ソースコードではなく、実データ資産に対する read-file の用途に最適です。

Office Documents

お気に入り 0GitHub 443

tzst

作成者 xixu-me

tzst は、`.tzst` や `.tar.zst` アーカイブのインストール、作成、一覧表示、テスト、展開を、適切なコマンドやフラグ、安全な既定値で進めるための CLI 特化スキルです。tzst install、tzst の使い方、フィルタリング、競合処理、ストリーミング、File Automation ワークフローの判断材料として使えます。

File Automation

お気に入り 0GitHub 6