defuddle

作成者 kepano

defuddleは、Defuddle CLIでWebページからノイズの少ないMarkdownを抽出できるスキルです。調査、ドキュメント作成、記事執筆向けに、不要な要素を取り除いた本文を取得したい場面に向いています。通常のHTMLページで使い、npmでインストールしてください。.mdで終わるURLは対象外です。

スター19.7k

お気に入り0

追加日2026年4月5日

カテゴリーWeb Research

インストールコマンド

npx skills add kepano/obsidian-skills --skill defuddle

編集スコア

このスキルの評価は76/100です。ディレクトリ掲載に十分適した、堅実な候補と言えます。エージェントにとっては発動条件が明確で、コマンドの使い方もシンプル、さらに通常のWebページでは汎用的な取得手段よりDefuddleを使う理由もはっきりしています。導入判断に必要な情報はひと通りそろっていますが、内容は外部CLIを手軽に使うための軽量なラッパー寄りで、深くガイドされたワークフローを期待する用途には向きません。

76/100

強み

トリガー条件が明確です。標準的なWeb URLをユーザーが提示して、内容を読んだり解析したりしたい場合にDefuddleを使うべきこと、また .md で終わるURLには使わないことが明示されています。
運用面で分かりやすく、インストール方法に加えて、Markdown抽出、ファイル出力、metadata取得の具体的なコマンドが示されています。
エージェント活用の利点が伝わりやすく、ナビゲーション、広告、雑多な要素を除去することで、生のページ取得よりトークン消費を抑えやすいという実務上のメリットが説明されています.

注意点

.md URLを除外する点以外のエッジケース案内は限定的で、失敗時の扱い、非対応ページ、認証が必要なページ、動的サイトへの対応は説明されていません。
補足資料は最小限で、想定される出力例を示すスクリプト、参考情報、サンプルがありません。そのため導入判断や運用イメージは、短いSKILL.mdの内容に大きく依存します。

Cli Npm Markdown Websites Documentation Blog Automation

概要

defuddle skill の概要

defuddle skill でできること

defuddle は、通常の Web ページを、単純な fetch よりもはるかにノイズの少ない、読みやすい markdown に変換する skill です。記事、ドキュメント、ガイド、ブログ投稿など、HTML ページの本文を読みたい場面に向いています。メニュー、広告、サイドバー、ナビゲーションのような要素がトークンを無駄にし、分析の邪魔になるケースで特に効果を発揮します。

Web Research で defuddle skill が向いているケース

defuddle for Web Research は、サイトの見た目や生の HTML を確認したいのではなく、ページ本文を読んだり、要約したり、比較したり、引用したり、分析したいときに使うのが最適です。いちばんの価値は、後続の推論や処理に適した、クリーンな入力を作れることにあります。ユーザーが一般的なページ URL を渡してきて、その中身を取り出したいのであれば、汎用的な web fetch より defuddle usage を起点にするほうが、たいていは適切です。

defuddle skill の主な制約と、使わないほうがよい場面

もっとも重要な境界はシンプルです。URL が .md で終わるページには defuddle を使わないでください。そうしたページはすでに markdown なので、直接 fetch したほうがきれいで、余計な変換も避けられます。また、厳密なページ構造、インタラクティブ要素、スクリプト、完全な DOM の忠実性が必要な用途にも向いていません。

なぜユーザーは defuddle skill を選ぶのか

実務上の違いは、「ページを取ってこられるか」ではなく、「主要な本文を、トークン効率のよい形式で素早く取り出せるか」にあります。だからこそ defuddle skill は、リサーチ用パイプライン、ノート収集、記事要約、ドキュメント読解のように、きれいな markdown が出力品質を大きく左右するワークフローで選ばれます。

defuddle skill の使い方

defuddle のインストールと基本コマンド

defuddle install については、リポジトリで Defuddle CLI 本体が案内されています。

npm install -g defuddle

基本コマンドはこちらです。

defuddle parse <url> --md

--md は一貫して付けるのがおすすめです。ほとんどの調査・分析ワークフローでは、この出力形式が推奨されます。見た目のノイズを落としつつ、読みやすい構造は保てるためです。

defuddle skill に必要な入力

defuddle skill に必要なのはページ URL と、できれば何をしたいのかが分かる明確な意図です。よい入力には、次の情報が含まれます。

正確な URL
そのページから何を得たいか
完全な markdown が必要か、保存したいのか、メタデータだけでよいのか

例:

「この記事を読んで、主張の要点を要約して: <url>」
「この docs ページからクリーンな markdown を抽出して content.md に保存して: <url>」
「<url> のページタイトルと description だけ取得して」

便利なコマンド:

defuddle parse <url> --md -o content.md
defuddle parse <url> -p title
defuddle parse <url> -p description
defuddle parse <url> -p domain

あいまいな依頼を、効果的な defuddle プロンプトに変える

弱い依頼: 「この URL を見て」

よりよい defuddle guide 向けプロンプト:

「<url> に defuddle を markdown 出力で使って。サイトナビゲーションは無視して、そのあと要点を 5 つの箇条書きで要約し、最重要セクションを引用して。」
「このドキュメントページ <url> に defuddle を使って。markdown を抽出し、セットアップ手順、前提条件、注意点を特定して、チェックリスト形式に書き直して。」
「まず <url> からメタデータだけ取得して。title と description がテーマに合っていたら、その後に完全な markdown を抽出して。」

この形のほうがうまくいくのは、defuddle をどう呼び出すかだけでなく、整形後のコンテンツをその後どう扱うかまでエージェントに伝えられるからです。

defuddle skill の FAQ

defuddle skill は、普通のプロンプト＋fetch より優れていますか？

記事系のページでは、多くの場合 yes です。通常の fetch には、ヘッダー、フッター、Cookie 通知、ナビゲーションなどがそのまま含まれがちです。defuddle usage を挟むことで、分析前の段階でノイズを減らせるため、トークンコストを抑えやすくなり、無関係なページ要素に引っ張られた要約ミスも減らせます。

どんなときに defuddle skill を使うべきではありませんか？

.md URL、raw ファイル、厳密な HTML、埋め込みメディアの挙動、ページスクリプト、レイアウトの詳細が必要なケースでは defuddle は避けてください。これはコンテンツ抽出ツールであり、ブラウザ自動化ツールでも DOM 検査ツールでもありません。

defuddle skill は初心者にも使いやすいですか？

はい。コマンド体系は非常に小さく、基本は一度インストールして defuddle parse <url> --md を使うだけです。そのため defuddle skill は、調査やノート収集のために、まずはきれいな元テキストを取りたいだけという人でも導入しやすくなっています。

defuddle はどんな出力を返せますか？

--md で markdown、--json で JSON、デフォルトでは HTML、-p <name> で特定のメタデータを取得できます。多くの読解・調査タスクでは markdown が最適なデフォルトです。メタデータモードは、素早い妥当性確認や振り分けに役立ちます。

defuddle skill を改善する方法

defuddle には、狙ったページを正確に渡す

defuddle の結果を改善するいちばん簡単な方法は、ホームページ、検索結果ページ、一覧ページではなく、正規のコンテンツページを渡すことです。記事 URL や単一の docs ページは、ナビゲーションや重複リンクだらけのハブページより、きれいな markdown を生成しやすくなります。

defuddle skill では、抽出後の作業も同じ依頼に含める

defuddle skill は、抽出と次の作業をセットで依頼すると強みが出ます。単に「これを parse して」で終わらせず、次のような目的まで指定してください。

要約
主要な主張
セットアップ手順
FAQ
引用
比較ポイント

こうすることで、引き継ぎ時のあいまいさが減り、エージェントも本来の job-to-be-done に沿って出力を組み立てやすくなります。

URL が怪しいときは、先にメタデータモードで確認する

URL がリダイレクトするかもしれない、品質が低いかもしれない、そもそも目的のページではないかもしれない、という場合は、まず次を実行してください。

defuddle parse <url> -p title
defuddle parse <url> -p description
defuddle parse <url> -p domain

これはシンプルですが効果的な defuddle guide のコツです。まず関連性を確認し、その後で完全な markdown 抽出に手間をかけるようにします。

defuddle skill で起こりやすい失敗パターンと改善の回し方

出力が薄い、あるいは構造がおかしいと感じる場合、原因は CLI ではなく元ページにあることが少なくありません。より具体的な URL を試す、カテゴリーページではなく記事ページに切り替える、markdown を保存して手動で中身を確認するといった対応が有効です。最初の結果が広すぎるなら、defuddle for Web Research を「セットアップ手順だけ抽出して」「認証に関するセクションだけ引用して」のように、より狭い指示で再実行してください。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

pyzotero

作成者 K-Dense-AI

pyzoteroは、Zotero Web API v3向けのPythonクライアントです。このpyzoteroスキルを使うと、ライブラリ運用のインストール、利用、自動化をスムーズに進められます。たとえば、文献データの読み取り・作成・更新・削除・検索、コレクションやタグの管理、添付ファイルの扱い、引用のエクスポートまで対応可能です。学術研究や再現性の高い文献管理のための、実用的なpyzoteroガイドです。

Academic Research

お気に入り 0GitHub 21.3k

notion-research-documentation

作成者 makenotion

notion-research-documentation は、散らばった Notion ページを引用付きのリサーチドキュメントにまとめるスキルです。検索、取得、要約、構造化ページの作成までを行い、ナレッジベース記事、技術ブリーフ、社内調査を、出典と実行しやすい示唆つきで整理します。

Knowledge Base Writing

お気に入り 0GitHub 107

seo-hreflang

作成者 AgriciDaniel

seo-hreflang は、多言語・多地域サイト向けの hreflang マークアップを検証・生成するための skill です。HTML、HTTPヘッダー、XMLサイトマップ全体で、自己参照、return tag、x-default、有効な言語・地域コードを確認するのに使えます。信頼できる seo-hreflang ガイドの支援が必要な SEO コンテンツチームに最適です。

SEO Content

お気に入り 0GitHub 0

gget

作成者 K-Dense-AI

ggetは、CLIまたはPythonから20以上のゲノムデータベースと解析ツールへ高速かつ統一的にアクセスできる生物情報学スキルです。遺伝子情報、BLAST関連の検索、AlphaFold構造、発現データ、疾患関連、エンリッチメント系の解析に使えます。素早い探索や、ggetを使ったData Analysisワークフローに向いています。

Data Analysis

お気に入り 0GitHub 0

deep-research

作成者 affaan-m

deep-researchスキルは、幅広い問いを firecrawl と exa の MCP ツールを使った出典付きのWebリサーチに変換します。情報源の比較、調査結果の統合、引用付きレポートの作成に使え、競合分析、技術評価、デューデリジェンスなど、根拠が必要な意思決定に役立ちます。

Web Research

お気に入り 0GitHub 156.1k

paper-lookup

作成者 K-Dense-AI

paper-lookup は Academic Research 向けの文献検索スキルです。学術論文、プレプリント、引用情報、DOI/PMID の一致、要旨、全文、オープンアクセス版を 10 の学術データベース横断で見つけるのに役立ちます。汎用のウェブ検索ではなく、まず適切な出典を押さえたいときの paper-lookup 利用に向いています。paper-lookup のガイドは、PubMed、PMC、Crossref、OpenAlex、Semantic Scholar、CORE、arXiv、bioRxiv、medRxiv、Unpaywall を参照します。

Academic Research

お気に入り 0GitHub 21.3k

seo-drift

作成者 AgriciDaniel

seo-drift は、SEOに重要なページ要素の変化を時系列で追跡し、ベースラインと比較して、デプロイ後、CMS編集後、テンプレート変更後の劣化を検出するための GitHub スキルです。SEOコンテンツの確認、技術的なオンページチェック、そして何か壊れたのかを明確に判断したいときの実用的な seo-drift の使いどころを知るために使えます。

SEO Content

お気に入り 0GitHub 6.2k

seo-dataforseo

作成者 AgriciDaniel

seo-dataforseo は、DataForSEO MCP サーバーを通じて Claude をライブの SEO データにつなぎ、SERP 確認、キーワード調査、被リンク、オンページ分析、競合調査、ビジネスリスティング、AI 可視性トラッキングを可能にします。実際の検索根拠が必要で、導入判断をしやすい明確な手順と、実務に使える seo-dataforseo の活用法を求めるデータ重視のワークフローに最適です。

Keyword Research

お気に入り 0GitHub 6.2k

company-research

作成者 deanpeters

company-research は、公開情報をもとに、経営層向けの会社ブリーフを作成するのに役立ちます。経営陣の引用、製品戦略、変革のテーマ、組織の文脈まで整理できます。インタビュー、競合分析、提携検討、市場参入リサーチに活用できます。

Competitive Analysis

お気に入り 0GitHub 4.1k

literature-review

作成者 K-Dense-AI

literature-reviewスキルは、Academic Research向けの体系的な文献レビュー・ワークフローを支援します。ソース探索、引用の検証、テーマ別の統合、整った markdown または PDF 出力までカバーします。文献レビューのガイド作成、メタアナリシス、スコーピングレビュー、各種研究ブリーフに活用でき、科学・技術分野全般で有用です。

Academic Research

お気に入り 0GitHub 0

exa-search

作成者 K-Dense-AI

exa-search は、Exa を活用した Web リサーチスキルです。現在の情報を見つけたり、URL からコンテンツを抽出したりする用途に向いています。検索、ソース探索、記事や PDF の抽出、意味ベースの検索、学術的な絞り込みを使った技術・科学リサーチに利用でき、導入と使い方もわかりやすく整理されています。

Web Research

お気に入り 0GitHub 0

seo-content

作成者 AgriciDaniel

seo-contentは、信頼性・有用性・AI引用の準備状況を見極めるための、実用的なコンテンツ品質とE-E-A-T分析スキルです。SEOコンテンツの監査、薄いコンテンツのチェック、信頼シグナルの確認、下書きや公開URLに対するページタイプの網羅性確認に活用できます。

SEO Content

お気に入り 0GitHub 6.2k

seo-audit

作成者 AgriciDaniel

seo-auditは、並列サブエージェントへの分担を使ってWebサイト全体のSEO監査を実行します。最大500ページまでクロールし、業種も判定します。技術面、コンテンツ、schema、パフォーマンス、ビジュアル、ローカル、geoシグナルまで網羅し、サイト全体のレビューとSEOコンテンツ分析に向けて、ヘルススコアと優先度付きの改善提案を返します。

SEO Content

お気に入り 0GitHub 6.2k

use-my-browser

作成者 xixu-me

use-my-browserは、適切なWebレイヤーを選ぶためのブラウザ自動化戦略スキルです。公開Webツール、live Chrome、raw fetch、Playwrightを、サインイン必須の操作、動的ページ、DevTools起点の作業に応じて使い分けられます。

Browser Automation

お気に入り 0GitHub 6

imaging-data-commons

作成者 K-Dense-AI

imaging-data-commons は、idc-index を使って NCI Imaging Data Commons の公開がん画像データを検索・ダウンロードするためのスキルです。CT、MR、PET、病理データセットにまたがる imaging-data-commons の利用に向いており、メタデータ検索、ブラウザプレビュー、ライセンス確認、AI 学習やデータ分析のワークフローまでカバーします。認証は不要です。

Data Analysis

お気に入り 0GitHub 0

database-lookup

作成者 K-Dense-AI

database-lookupは、調査クエリを適切な公開データベースAPIへ振り分け、出典データベース名を添えた生のJSONを返します。化合物、遺伝子、タンパク質、変異、臨床試験、特許、環境データ、経済指標などで、一般的なWeb要約ではなくデータベース参照の道筋が必要なときに使ってください。

Web Research

お気に入り 0GitHub 0

defuddle

defuddle skill の概要

defuddle skill でできること

Web Research で defuddle skill が向いているケース

defuddle skill の主な制約と、使わないほうがよい場面

なぜユーザーは defuddle skill を選ぶのか

defuddle skill の使い方

defuddle のインストールと基本コマンド

defuddle skill に必要な入力

あいまいな依頼を、効果的な defuddle プロンプトに変える

おすすめのワークフローと、最初に読むべきファイル

defuddle skill の FAQ

defuddle skill は、普通のプロンプト＋fetch より優れていますか？

どんなときに defuddle skill を使うべきではありませんか？

defuddle skill は初心者にも使いやすいですか？

defuddle はどんな出力を返せますか？

defuddle skill を改善する方法

defuddle には、狙ったページを正確に渡す

defuddle skill では、抽出後の作業も同じ依頼に含める

URL が怪しいときは、先にメタデータモードで確認する

defuddle skill で起こりやすい失敗パターンと改善の回し方

評価とレビュー