defuddle

por kepano

defuddle extrae markdown limpio de páginas web con la CLI de Defuddle, eliminando elementos innecesarios para investigación, documentación y artículos. Úsalo con páginas HTML estándar, instálalo con npm y evita las URLs que terminen en .md.

Estrellas19.7k

Favoritos0

Comentarios0

Agregado5 abr 2026

CategoríaWeb Research

Comando de instalación

npx skills add kepano/obsidian-skills --skill defuddle

Puntuación editorial

Esta skill obtiene una puntuación de 76/100, lo que la convierte en una candidata sólida para el directorio: los agentes tienen un activador claro, un patrón de comandos sencillo y un motivo concreto para usarla en lugar de una captura web genérica en páginas web normales. Los usuarios del directorio pueden tomar una decisión de instalación con fundamento, aunque conviene esperar un wrapper ligero sobre una CLI externa y no un flujo de trabajo muy guiado.

76/100

Puntos fuertes

Alta capacidad de activación: indica explícitamente que se use Defuddle cuando el usuario proporcione una URL web estándar para leer o analizar, y no para URLs que terminen en .md.
Claridad operativa: la skill ofrece orientación de instalación y comandos concretos para extraer markdown, guardar archivos y recuperar metadatos.
Buen aprovechamiento para agentes: explica la ventaja práctica de eliminar navegación, anuncios y otros elementos superfluos para reducir el uso de tokens frente a obtener la página en bruto.

Puntos a tener en cuenta

Orientación limitada para casos límite: aparte de excluir las URLs .md, no explica cómo manejar fallos, páginas no compatibles, muros de autenticación o sitios dinámicos.
Material de apoyo mínimo: no hay scripts, referencias ni ejemplos que muestren los resultados esperados, por lo que la adopción depende solo del breve SKILL.md.

Cli Npm Markdown Websites Documentation Blog Automation

Resumen

Descripción general de la skill defuddle

Qué hace la skill defuddle

La skill defuddle convierte una página web normal en markdown limpio y legible, con mucho menos ruido que un fetch sin procesar. Está pensada para páginas como artículos, documentación, guías, posts de blog y otras páginas HTML donde los menús, anuncios, barras laterales y la navegación consumen tokens y distraen el análisis.

Cuándo encaja mejor para investigación web

Usa defuddle para Web Research cuando tu objetivo real sea leer, resumir, comparar, citar o analizar el contenido de una página, en lugar de inspeccionar el chrome del sitio o el HTML sin procesar. Su valor principal es ofrecer una entrada más limpia para el razonamiento posterior. Si un usuario te da la URL de una página estándar y quiere acceder al contenido, el uso de defuddle suele ser un mejor punto de partida que un fetch web genérico.

Límites clave y cuándo no conviene usarla

El límite más importante es simple: no uses defuddle con URLs que terminen en .md. Esas páginas ya están en markdown, así que un fetch directo es más limpio y evita una transformación innecesaria. Tampoco encaja bien cuando necesitas la estructura exacta de la página, elementos interactivos, scripts o fidelidad completa del DOM.

Por qué los usuarios eligen defuddle

La diferencia práctica no es “si puede obtener una página”, sino “si puede darme el texto principal en un formato eficiente en tokens y rápido”. Eso hace que la skill defuddle resulte especialmente útil en flujos de investigación, captura de notas, resumen de artículos y lectura de documentación, donde un markdown más limpio mejora de forma tangible la calidad del resultado.

Cómo usar la skill defuddle

Instalación de defuddle y comando básico

Para la instalación de defuddle, el repositorio apunta directamente al Defuddle CLI:

npm install -g defuddle

Comando principal:

defuddle parse <url> --md

Usa --md de forma consistente. Es la salida recomendada para la mayoría de flujos de investigación y análisis, porque elimina ruido visual sin perder una estructura legible.

Qué entradas necesita la skill defuddle

La skill defuddle necesita una URL de página y, preferiblemente, una intención clara. Una buena entrada incluye:

la URL exacta
qué necesitas obtener de ella
si quieres markdown completo, guardar la salida o solo metadatos

Ejemplos:

“Lee este artículo y resume el argumento principal: <url>”
“Extrae markdown limpio de esta página de documentación y guárdalo en content.md: <url>”
“Obtén solo el título y la descripción de la página para <url>”

Comandos útiles:

defuddle parse <url> --md -o content.md
defuddle parse <url> -p title
defuddle parse <url> -p description
defuddle parse <url> -p domain

Cómo convertir un objetivo difuso en un buen prompt para defuddle

Solicitud débil: “Mira esta URL”.

Mejor prompt de guía de defuddle:

“Usa defuddle en <url> con salida markdown. Ignora la navegación del sitio. Después resume los puntos clave en 5 viñetas y cita la sección más importante.”
“Usa defuddle para esta página de documentación: <url>. Extrae el markdown, identifica pasos de configuración, prerrequisitos y advertencias, y luego reescríbelos como una checklist.”
“Extrae primero solo los metadatos de <url>. Si el título y la descripción coinciden con el tema, entonces extrae el markdown completo.”

Esto funciona mejor porque le indica al agente tanto cómo invocar defuddle como qué hacer después con el contenido ya limpio.

Flujo recomendado y qué leer primero

Esta skill es deliberadamente pequeña. Lee primero skills/defuddle/SKILL.md porque ahí está todo el flujo utilizable: instalación, comando de parsing, formatos de salida y propiedades de metadatos. En la práctica, usa esta secuencia:

Comprueba si la URL es una página HTML normal o un archivo .md.
Ejecuta defuddle parse <url> --md.
Si necesitas un artefacto reutilizable, añade -o content.md.
Si solo necesitas enrutamiento o validación, consulta metadatos con -p.
Pasa el markdown limpio a una fase de resumen, extracción o toma de notas.

Preguntas frecuentes sobre la skill defuddle

¿Es defuddle mejor que un prompt normal más fetch?

Por lo general, sí para páginas tipo artículo. Un fetch normal suele incluir cabeceras, pies de página, avisos de cookies y navegación. El uso de defuddle mejora la relación señal-ruido antes de que empiece el análisis, lo que puede reducir el coste en tokens y disminuir errores de resumen causados por elementos irrelevantes de la página.

¿Cuándo no debería usar la skill defuddle?

Evita defuddle en URLs .md, archivos en bruto o casos en los que necesites HTML exacto, comportamiento de medios incrustados, scripts de página o detalles de maquetación. Es una herramienta de extracción de contenido, no una herramienta de automatización de navegador ni de inspección del DOM.

¿La skill defuddle es apta para principiantes?

Sí. La superficie de comandos es muy pequeña: instalas una vez y luego usas defuddle parse <url> --md. Eso hace que la skill defuddle sea fácil de adoptar incluso si solo quieres texto fuente más limpio para investigación o captura de notas.

¿Qué salidas puede devolver defuddle?

Puedes obtener markdown con --md, JSON con --json, HTML por defecto o metadatos concretos con -p <name>. Para la mayoría de tareas de lectura e investigación, markdown es la mejor opción por defecto; el modo de metadatos resulta útil para validación rápida y enrutamiento.

Cómo mejorar la skill defuddle

Dale a defuddle una página de destino precisa

La forma más sencilla de mejorar los resultados de defuddle es proporcionar la página canónica de contenido, no una homepage, una página de búsqueda ni una página de listado. Las URLs de artículos y las páginas individuales de documentación generan markdown más limpio que los hubs llenos de navegación y enlaces repetidos.

Pide la tarea posterior en la misma solicitud

La skill defuddle funciona mejor cuando la extracción se combina con un siguiente paso concreto. En lugar de limitarte a decir “parsea esto”, pide:

resumen
afirmaciones clave
pasos de configuración
FAQs
citas
puntos de comparación

Eso reduce la ambigüedad en el traspaso y ayuda al agente a estructurar la salida en torno al trabajo real que necesitas resolver.

Usa el modo de metadatos antes de la extracción completa si tienes dudas

Si la URL puede redirigir, ser de baja calidad o no ser la página correcta, empieza con:

defuddle parse <url> -p title
defuddle parse <url> -p description
defuddle parse <url> -p domain

Esta es una táctica simple pero eficaz de guía de defuddle: primero valida la relevancia y después invierte esfuerzo en extraer el markdown completo.

Fallos habituales y cómo iterar con defuddle para Web Research

Si la salida se siente escasa o con una estructura extraña, el problema suele estar en la página de origen, no en el CLI. Prueba una URL más específica, cambia de una página de categoría a una página de artículo, o guarda el markdown para inspeccionarlo manualmente. Si el primer resultado es demasiado amplio, vuelve a ejecutar defuddle para Web Research con una instrucción más acotada, como “extrae solo los pasos de configuración” o “cita solo las secciones sobre autenticación”.

Calificaciones y reseñas

Aún no hay calificaciones

Comparte tu reseña

Inicia sesión para dejar una calificación y un comentario sobre esta skill.

0/10000

Reseñas más recientes

Guardando...

Más skills de esta categoría

pyzotero

por K-Dense-AI

pyzotero es un cliente en Python para la API Web v3 de Zotero. Esta skill de pyzotero te ayuda a instalarlo, usarlo y automatizar flujos de trabajo de biblioteca: leer, crear, actualizar, eliminar, buscar, gestionar colecciones y etiquetas, manejar adjuntos y exportar citas. Es una guía sólida de pyzotero para investigación académica y gestión reproducible de referencias.

Academic Research

Favoritos 0GitHub 21.3k

notion-research-documentation

por makenotion

notion-research-documentation convierte páginas dispersas de Notion en un documento de investigación con fuentes citadas. Busca, recupera, sintetiza y crea páginas estructuradas para redactar bases de conocimiento, informes técnicos e investigación interna con fuentes claras e ideas accionables.

Knowledge Base Writing

Favoritos 0GitHub 107

seo-hreflang

por AgriciDaniel

seo-hreflang ayuda a validar y generar marcado hreflang para sitios multilingües y multirregión. Úsalo para comprobar autorreferencias, etiquetas de retorno, `x-default` y códigos válidos de idioma-región en HTML, encabezados HTTP y sitemaps XML. Ideal para equipos de contenido SEO que necesitan una guía fiable de seo-hreflang.

SEO Content

Favoritos 0GitHub 0

gget

por K-Dense-AI

gget es una skill de bioinformática para acceder de forma rápida y unificada a más de 20 bases de datos genómicas y herramientas de análisis desde CLI o Python. Úsala para información de genes, búsquedas relacionadas con BLAST, estructuras de AlphaFold, datos de expresión, asociaciones con enfermedades y análisis de enriquecimiento. Encaja bien para exploración rápida y flujos de trabajo de análisis de datos con gget.

Data Analysis

Favoritos 0GitHub 0

deep-research

por affaan-m

La skill deep-research convierte preguntas amplias en investigación web respaldada por fuentes con las herramientas MCP de firecrawl y exa. Úsala para comparar fuentes, sintetizar hallazgos y producir informes citados para análisis competitivos, evaluación de tecnología, due diligence y otras decisiones que requieren evidencia.

Web Research

Favoritos 0GitHub 156.1k

paper-lookup

por K-Dense-AI

paper-lookup es una skill de recuperación de información para Investigación Académica, pensada para encontrar artículos científicos, preprints, citas, coincidencias de DOI/PMID, resúmenes, texto completo y copias de acceso abierto en 10 bases de datos académicas. Úsala para paper-lookup cuando necesites primero la fuente correcta, no una búsqueda web genérica. La guía de paper-lookup apunta a PubMed, PMC, Crossref, OpenAlex, Semantic Scholar, CORE, arXiv, bioRxiv, medRxiv y Unpaywall.

Academic Research

Favoritos 0GitHub 21.3k

seo-drift

por AgriciDaniel

seo-drift es una skill de GitHub para seguir a lo largo del tiempo elementos clave de una página para SEO, comparar líneas base y detectar regresiones después de despliegues, cambios en el CMS o modificaciones de plantillas. Usa la skill seo-drift para contenido SEO, comprobaciones técnicas on-page y uso práctico de seo-drift cuando necesites una respuesta clara sobre si algo se rompió.

SEO Content

Favoritos 0GitHub 6.2k

seo-dataforseo

por AgriciDaniel

seo-dataforseo conecta Claude con datos SEO en vivo a través del servidor MCP de DataForSEO para comprobar SERP, investigar palabras clave, analizar backlinks y on-page, estudiar la competencia, revisar fichas de negocio y seguir la visibilidad en IA. Es ideal para flujos de trabajo basados en datos cuando necesitas evidencia real de búsqueda, una guía de instalación clara y un uso práctico de seo-dataforseo.

Keyword Research

Favoritos 0GitHub 6.2k

company-research

por deanpeters

company-research te ayuda a crear un informe ejecutivo de empresa a partir de fuentes públicas, incluidas citas de líderes, estrategia de producto, temas de transformación y contexto organizativo. Úsalo para entrevistas, análisis competitivo, alianzas e investigación de entrada a mercado.

Competitive Analysis

Favoritos 0GitHub 4.1k

literature-review

por K-Dense-AI

La skill literature-review facilita flujos de trabajo sistemáticos de revisión bibliográfica para investigación académica, incluyendo localización de fuentes, verificación de citas, síntesis temática y resultados pulidos en Markdown o PDF. Úsala para tareas de guías de literature-review, metaanálisis, revisiones exploratorias y briefs de investigación en ámbitos científicos y técnicos.

Academic Research

Favoritos 0GitHub 0

exa-search

por K-Dense-AI

exa-search es una skill de investigación web impulsada por Exa para encontrar información actual y extraer contenido de URLs. Úsala para búsquedas, descubrimiento de fuentes, extracción de artículos y PDF, e investigación técnica o científica con recuperación semántica, filtrado al estilo académico y una guía clara de instalación y uso.

Web Research

Favoritos 0GitHub 0

seo-content

por AgriciDaniel

seo-content es una skill práctica para analizar la calidad del contenido y evaluar credibilidad, utilidad y preparación para citas de IA. Usa la skill seo-content para auditorías de contenido SEO, detección de contenido superficial, revisión de señales de confianza y cobertura por tipo de página, tanto en borradores como en URLs publicadas.

SEO Content

Favoritos 0GitHub 6.2k

seo-audit

por AgriciDaniel

seo-audit realiza una auditoría SEO completa de un sitio web con delegación paralela a subagentes, rastrea hasta 500 páginas y detecta el tipo de negocio. Cubre señales técnicas, de contenido, schema, rendimiento, visuales, locales y geográficas, y luego devuelve un health score con correcciones priorizadas para la revisión integral del sitio y el análisis de contenido SEO.

SEO Content

Favoritos 0GitHub 6.2k

use-my-browser

por xixu-me

use-my-browser es una skill de estrategia para automatización del navegador que ayuda a elegir la capa web adecuada: herramientas web públicas, Chrome en vivo, raw fetch o Playwright para tareas con inicio de sesión, contenido dinámico y flujos basados en DevTools.

Browser Automation

Favoritos 0GitHub 6

imaging-data-commons

por K-Dense-AI

imaging-data-commons te ayuda a consultar y descargar datos públicos de imagen médica oncológica de NCI Imaging Data Commons con idc-index. Úsalo para trabajar con imaging-data-commons en conjuntos de CT, MR, PET y patología, incluyendo búsqueda de metadatos, vista previa en el navegador, comprobaciones de licencias y flujos de trabajo para entrenamiento de IA o análisis de datos. No requiere autenticación.

Data Analysis

Favoritos 0GitHub 0

database-lookup

por K-Dense-AI

database-lookup ayuda a enrutar preguntas de investigación hacia la API pública de base de datos adecuada y devuelve JSON sin procesar con el nombre de las bases de datos de origen. Úsalo para compuestos, genes, proteínas, variantes, ensayos clínicos, patentes, datos ambientales o indicadores económicos cuando necesites una guía de database-lookup en lugar de un resumen web genérico.

Web Research

Favoritos 0GitHub 0