firecrawl-download

por firecrawl

firecrawl-download te ayuda a descargar un sitio o una sección de documentación en archivos locales organizados dentro de `.firecrawl/`. Combina mapeo del sitio y scraping, admite markdown, enlaces y capturas de pantalla, y resulta útil para copias offline de documentación, captura masiva de páginas y flujos prácticos de Web Scraping.

Estrellas234

Favoritos0

Comentarios0

Agregado31 mar 2026

CategoríaWeb Scraping

Comando de instalación

npx skills add firecrawl/cli --skill firecrawl-download

Puntuación editorial

Esta skill obtiene 73/100, lo que significa que puede incluirse para usuarios del directorio: el disparador de uso es claro y el flujo de trabajo es real, pero adoptarla todavía exige cierta interpretación porque el repositorio solo ofrece un único `SKILL.md` con pocos detalles operativos más allá de ejemplos de comandos.

73/100

Puntos fuertes

Alta capacidad de activación: la descripción menciona intenciones de uso concretas como "download the site", "offline copy" y "download all the docs".
Valor real para agentes: combina mapeo del sitio y scraping en un solo comando y documenta opciones útiles como formatos, capturas de pantalla, include-paths y límites.
Ejemplos bastante accionables: el `SKILL.md` incluye comandos de inicio rápido y además indica explícitamente el uso de `-y` para omitir solicitudes de confirmación.

Puntos a tener en cuenta

La profundidad operativa es limitada: no hay archivos de soporte, referencias, instrucciones de instalación ni reglas de decisión para gestionar fallos, límites de escala o la administración de la salida.
La skill está marcada explícitamente como experimental, lo que añade cierto riesgo de confianza y estabilidad para flujos de agentes de estilo productivo.

Firecrawl Cli Scraping Websites Offline Markdown

Resumen

Visión general de la skill firecrawl-download

Qué hace firecrawl-download

La skill firecrawl-download sirve para una tarea muy concreta: descargar un sitio web o una sección de documentación en archivos locales organizados. Combina el descubrimiento del sitio con el scraping de páginas y luego guarda cada página dentro de .firecrawl/ como markdown, capturas de pantalla o varios formatos de salida por página.

Resulta especialmente útil si quieres una copia offline de documentación, un corpus local para investigación o una forma repetible de guardar muchas páginas para analizarlas después. Frente a un prompt genérico de scraping, firecrawl-download ofrece un camino más claro para capturar un sitio completo, sin obligarte a diseñar desde cero el flujo de rastreo.

Quién debería usar esta skill firecrawl-download

Los perfiles para los que mejor encaja son:

desarrolladores que quieren guardar documentación en local
investigadores que recopilan contenido de sitios para revisarlo
equipos que necesitan un archivo ligero de contenidos
agentes que requieren un flujo práctico de “descarga este sitio” con menos margen de improvisación

Si tu objetivo real es “guardar este sitio como archivos locales utilizables”, esta skill encaja mejor que un prompt amplio de web scraping.

Qué suele importar antes de instalarla

La mayoría de decisiones de instalación de firecrawl-download se reducen a cuatro preguntas:

¿Puede manejar un sitio completo o una sección de docs, y no solo una página?
¿Guarda la salida en una estructura local realmente utilizable?
¿Permite filtrar el alcance para no descargar páginas equivocadas?
¿Admite varios tipos de salida, como markdown y capturas?

Según el código y la definición de la skill, la respuesta es sí en los cuatro casos. La principal salvedad es que está marcada como experimental, así que conviene tratarla como un flujo de conveniencia y no como un sistema de archivado especialmente robusto.

Diferenciador clave para flujos de Web Scraping

Lo que diferencia a firecrawl-download for Web Scraping no es solo la potencia de scraping en bruto. La clave es que el comando agrupa:

mapeo del sitio primero
scraping después
salida en archivos por página
directorios locales anidados
reutilización de opciones de scrape durante la descarga

Eso hace que merezca más la pena instalarla para casos de uso de “descargar docs” que un simple comando de scrape que solo devuelve el contenido de una página.

Cómo usar la skill firecrawl-download

Contexto de instalación de firecrawl-download

La evidencia del repositorio indica que esta skill vive en firecrawl/cli, dentro de skills/firecrawl-download. Una vía práctica de instalación es:

npx skills add https://github.com/firecrawl/cli --skill firecrawl-download

Después de añadirla, revisa:

skills/firecrawl-download/SKILL.md

Esta skill tiene pocos archivos de soporte, así que SKILL.md es la fuente principal de referencia.

Lee primero este archivo

Empieza por:

skills/firecrawl-download/SKILL.md

Ese archivo deja claro enseguida el alcance real: firecrawl download es un comando experimental de conveniencia que combina map y scrape, guarda resultados dentro de .firecrawl/ y admite opciones de scrape durante la descarga.

Uso básico de firecrawl-download

La forma más rápida de usar la firecrawl-download skill es apuntarla a la raíz de documentación o contenido:

firecrawl download https://docs.example.com

Para ejecuciones desatendidas, la skill recomienda explícitamente:

firecrawl download https://docs.example.com -y

Usa -y siempre que quieras omitir confirmaciones en flujos con agentes o scripts.

Qué entradas necesita la skill para funcionar bien

Un prompt impreciso como “descarga este sitio” suele quedarse corto. Es mejor indicar:

la URL raíz
los límites de la sección que realmente quieres
el número máximo de páginas
los formatos de salida necesarios
si las capturas importan
qué excluir

Una petición más sólida sería:

“Use firecrawl-download to save https://docs.example.com locally as markdown with screenshots, include only /guides and /api, limit to 50 pages, and skip translated pages.”

Con eso la skill tiene suficiente contexto para mapear el alcance correcto antes de hacer scraping.

Comandos que más importan en la práctica

El código fuente muestra algunos patrones especialmente útiles:

# With screenshots
firecrawl download https://docs.example.com --screenshot --limit 20 -y

# Multiple formats per page
firecrawl download https://docs.example.com --format markdown,links --screenshot --limit 20 -y

# Filter by section
firecrawl download https://docs.example.com --include-paths "/features,/sdks"

Estos ejemplos importan porque reflejan bloqueos reales al adoptar la skill: demasiado contenido, secciones equivocadas o una salida con poca fidelidad.

Qué se escribe en local

La skill guarda la salida en directorios anidados dentro de .firecrawl/. Cuando pides varios formatos, cada página puede generar archivos separados como:

index.md
links.txt
screenshot.png

Esa organización local de archivos es una de las razones principales para preferir firecrawl-download install frente a un prompt puntual de scraping.

Cómo convertir un objetivo impreciso en un prompt útil

Si tu primera idea es:

“descarga este sitio de documentación”

reescríbela como:

URL objetivo
filtros de sección deseados
formatos de archivo
capturas sí/no
límite de páginas
exclusiones

Ejemplo de prompt para un agente:

“Use the firecrawl-download skill to download https://docs.example.com for offline use. Save as markdown plus screenshots, include only /getting-started,/api, cap at 30 pages, and use -y so the run is non-interactive.”

Esto funciona mejor porque elimina ambigüedades sobre el alcance y la salida.

Flujo recomendado para obtener resultados fiables

Un flujo práctico de la firecrawl-download guide es:

Empieza con la sección de documentación más pequeña que siga siendo útil.
Añade --include-paths antes de aumentar el número de páginas.
Haz la primera pasada con --limit.
Revisa la estructura de salida en .firecrawl/.
Añade --screenshot o varios formatos solo si realmente los necesitas.
Amplía el rastreo cuando la primera muestra ya se vea correcta.

Así evitas el fallo más habitual: descargar demasiado, demasiado pronto.

Cuándo usar firecrawl-download en lugar de un scrape normal

Usa firecrawl-download usage cuando necesites:

muchas páginas, no una sola
archivos locales, no solo texto devuelto
una copia offline navegable
una instantánea rápida de documentación para revisión o referencia

Usa un scrape normal cuando solo necesites una página o una lógica de extracción muy personalizada. El valor de firecrawl-download está en la rapidez del flujo para guardar contenido a escala de sitio.

Restricciones y tradeoffs que conviene conocer pronto

Las limitaciones prácticas más importantes según la skill son:

está marcada como experimental
está optimizada como comando de conveniencia
la calidad de salida sigue dependiendo de la estructura del sitio objetivo y de tus filtros de alcance
las ejecuciones amplias y sin límites pueden generar ruido o exceso de contenido

En otras palabras, la skill encaja muy bien para descargas controladas de documentación, pero no garantiza un archivado perfecto ni completo.

Preguntas frecuentes sobre la skill firecrawl-download

¿Es firecrawl-download buena para principiantes?

Sí, sobre todo si tu tarea es simplemente “guardar documentación en local”. Los ejemplos de comandos son directos y el asistente interactivo ayuda. Aun así, los principiantes deberían empezar con un --limit pequeño y --include-paths acotados para evitar descargas demasiado grandes.

¿Cuál es la diferencia real frente a un prompt genérico de scraping con IA?

Un prompt genérico puede describir la tarea, pero firecrawl-download ya incorpora el patrón útil: mapear el sitio, hacer scraping de cada página y guardar archivos en directorios. Eso reduce la fricción de configuración y hace que el flujo sea más repetible.

¿firecrawl-download es solo para sitios de documentación?

No, aunque la documentación es donde mejor encaja. Funciona mejor en sitios cuya estructura de páginas y rutas es razonablemente predecible. Los sitios muy dinámicos o mal acotados pueden requerir más filtrado o incluso otro enfoque.

¿Puede firecrawl-download guardar algo más que markdown?

Sí. La definición de la skill muestra explícitamente varios formatos por página y capturas opcionales. Esto es importante si necesitas tanto texto legible como evidencia visual de apoyo.

¿Cuándo no debería usar firecrawl-download?

Evita firecrawl-download si solo necesitas:

una página
un esquema de extracción personalizado
postprocesado profundo durante el scraping
un pipeline de archivado totalmente robusto con garantías más estrictas

En esos casos, puede encajar mejor un comando de scrape más específico o un flujo más personalizado.

Cómo mejorar la skill firecrawl-download

Dale primero un alcance más preciso a firecrawl-download

La forma más sencilla de mejorar los resultados de firecrawl-download es reducir la ambigüedad. Usa:

--include-paths
--limit
una URL raíz de documentación clara

Una ejecución acotada a 20 páginas suele ser más útil que una descarga descontrolada de todo el sitio.

Elige las salidas según el trabajo real que viene después

No pidas todos los formatos por defecto. Elige los que encajen con el siguiente paso:

markdown para lectura, búsqueda e ingesta por LLM
links cuando la estructura importa
--screenshot cuando importan el diseño o la evidencia visual de la interfaz

Así mantienes las ejecuciones más ligeras y la salida más fácil de revisar.

Haz una ejecución de muestra antes de la descarga completa

Un patrón de iteración sólido es:

firecrawl download https://docs.example.com --include-paths "/api" --limit 10 -y

Revisa los archivos guardados y luego amplía a más secciones o a límites más altos. Así detectas pronto decisiones de alcance equivocadas.

Fallos habituales y cómo evitarlos

Los problemas típicos son:

descargar secciones equivocadas
recopilar demasiadas páginas
olvidar -y en ejecuciones automatizadas
pedir salidas que en realidad no necesitas

La solución es simple: especifica el alcance, limita la primera ejecución y elige las salidas de forma intencional.

Mejora la calidad de los prompts en usos con agentes

Si un agente va a llamar a la skill, pídele:

URL exacta de inicio
propósito deseado de la salida local
secciones que incluir
secciones que evitar
formatos de salida
límite de tamaño de la ejecución

Buen prompt:

“Use firecrawl-download to create an offline markdown copy of https://docs.example.com, only for /guides and /reference, with screenshots for each page, limited to 40 pages, and save non-interactively.”

Eso produce una ejecución mejor que “descarga la documentación”.

Cómo iterar después de la primera salida

Después de la primera pasada, evalúa:

¿.firecrawl/ contenía las páginas que esperabas?
¿Había demasiadas páginas irrelevantes?
¿Necesitabas capturas o solo texto?
¿La siguiente ejecución debería ampliar o reducir las rutas incluidas?

La mejor forma de mejorar la firecrawl-download skill no es volver a ejecutarla a ciegas, sino ajustar el alcance y las opciones de salida según lo que haya producido realmente el primer lote.

Calificaciones y reseñas

Aún no hay calificaciones

Comparte tu reseña

Inicia sesión para dejar una calificación y un comentario sobre esta skill.

0/10000

Reseñas más recientes

Guardando...

Más skills de esta categoría

huggingface-datasets

por huggingface

Usa la skill huggingface-datasets para flujos de trabajo con la API de Dataset Viewer de Hugging Face: validar datasets, resolver splits, previsualizar y paginar filas, buscar texto, aplicar filtros y obtener enlaces de parquet o estadísticas. Es una guía práctica de huggingface-datasets para exploración de datasets en modo solo lectura.

Web Scraping

Favoritos 0GitHub 10.4k

data-scraper-agent

por affaan-m

data-scraper-agent ayuda a crear un pipeline repetible de datos públicos para web scraping, enriquecimiento y almacenamiento. Está pensado para supervisar trabajos, precios, noticias, repositorios, deportes y listados en un horario definido usando GitHub Actions, con salidas a Notion, Sheets o Supabase. Es ideal para el seguimiento continuo, no para extracciones puntuales.

Web Scraping

Favoritos 0GitHub 156.1k

baoyu-url-to-markdown

por JimLiu

baoyu-url-to-markdown convierte URLs activas a Markdown con un CLI baoyu-fetch incluido en el repositorio, usando Chrome CDP, adaptadores de sitio y una alternativa genérica. Revisa los requisitos de Bun, la configuración inicial de EXTEND.md y el uso para X, YouTube, Hacker News y páginas renderizadas.

Format Conversion

Favoritos 0GitHub 13.2k

x-twitter-scraper

por Xquik-dev

Usa x-twitter-scraper para obtener datos de X (Twitter) y acciones con verificación a través de Xquik. Admite búsqueda de tweets, consulta de usuarios, extracción de seguidores, descarga de medios, monitores, webhooks, MCP y acciones de escritura. Es ideal para investigación estilo web scraping con una API key, no para secretos de inicio de sesión de X.

Web Scraping

Favoritos 0GitHub 71

exa-search

por K-Dense-AI

exa-search es una skill de investigación web impulsada por Exa para encontrar información actual y extraer contenido de URLs. Úsala para búsquedas, descubrimiento de fuentes, extracción de artículos y PDF, e investigación técnica o científica con recuperación semántica, filtrado al estilo académico y una guía clara de instalación y uso.

Web Research

Favoritos 0GitHub 0

browser-use

por browser-use

browser-use es una skill de automatización del navegador para abrir páginas, inspeccionar el estado, hacer clic en elementos indexados, escribir en campos, tomar capturas y reutilizar una sesión persistente del navegador. Úsala para completar formularios con fiabilidad, navegar por sitios y ejecutar flujos con sesión iniciada mediante la CLI de browser-use.

Browser Automation

Favoritos 0GitHub 84.9k

remote-browser

por browser-use

remote-browser ayuda a los agentes en entornos aislados a controlar un navegador sin interfaz para Browser Automation. Úsalo para abrir páginas, inspeccionar el estado, hacer clic en elementos indexados, introducir texto, tomar capturas de pantalla y conectarte a apps locales o a sesiones de navegador compatibles con CDP.

Browser Automation

Favoritos 0GitHub 84.9k

firecrawl

por firecrawl

Skill de firecrawl para instalar, autenticarse y usar la CLI oficial de Firecrawl para scraping web, búsqueda, rastreo e interacción con páginas. Aprende la configuración, `firecrawl --status`, el inicio de sesión, la salida segura de archivos en `.firecrawl/` y patrones de uso prácticos respaldados por el repositorio.

Web Scraping

Favoritos 0GitHub 234

firecrawl-search

por firecrawl

firecrawl-search es una skill de investigación web para encontrar fuentes, realizar búsquedas estructuradas y, opcionalmente, extraer el contenido completo de páginas como JSON con Firecrawl CLI.

Web Research

Favoritos 0GitHub 234

parallel-web

por K-Dense-AI

parallel-web es una skill de investigación y extracción web impulsada por parallel-cli. Ayuda a buscar en la web, extraer contenido de URLs, enriquecer datos a partir de fuentes y realizar investigaciones más profundas, con prioridad para fuentes académicas y científicas. Úsala para el uso de parallel-web, la investigación web, las citas y flujos de trabajo basados en evidencia.

Web Research

Favoritos 0GitHub 0

geomaster

por K-Dense-AI

geomaster es una skill de ciencia geoespacial para flujos de trabajo de SIG, teledetección, análisis espacial y observación de la Tierra. Úsala en tareas de análisis de datos como operaciones raster y vectoriales, procesamiento de imágenes satelitales, métricas espaciales y planificación de flujos de trabajo. La guía de geomaster te ayuda a instalar, revisar y aplicar la skill con menos conjeturas.

Data Analysis

Favoritos 0GitHub 0

asc-aso-audit

por rudrankriyam

asc-aso-audit te ayuda a ejecutar una auditoría ASO offline sobre los metadatos canónicos de App Store en `./metadata`, y luego a detectar brechas de palabras clave con Astro MCP. Usa la skill asc-aso-audit después de `asc metadata pull` para revisar `subtitle`, `keywords`, `description` y `whatsNew` con menos margen de error.

Data Analysis

Favoritos 0GitHub 0

ffuf-web-fuzzing

por jthack

ffuf-web-fuzzing es una habilidad práctica para descubrir contenido web oculto, probar rutas y parámetros, y hacer fuzzing de objetivos autenticados con solicitudes en bruto, auto-calibración y análisis de resultados. Encaja con testers de seguridad que necesitan una guía repetible de ffuf-web-fuzzing para pruebas de penetración y flujos de trabajo de auditoría de seguridad.

Security Audit

Favoritos 0GitHub 0

web-to-markdown

por softaworks

web-to-markdown es una skill de conversión de formato que transforma páginas web en vivo en Markdown limpio mediante el CLI local `web2md`, usando un navegador de la familia Chromium para páginas renderizadas con JS, flujos interactivos y conversión por lotes de URLs. Solo se ejecuta cuando se invoca explícitamente por nombre.

Format Conversion

Favoritos 0GitHub 1.3k

firecrawl-agent

por firecrawl

firecrawl-agent ayuda a extraer JSON estructurado de sitios web complejos y de varias páginas. Descubre cuándo conviene usarlo, cómo ejecutar el agente de Firecrawl CLI, añadir esquemas, definir URLs iniciales y guardar resultados para extraer precios, productos y datos tipo directorio.

Web Scraping

Favoritos 0GitHub 234

firecrawl-map

por firecrawl

firecrawl-map ayuda a los agentes a descubrir y listar URLs de un sitio, con opciones de filtrado por búsqueda, límites, salida en JSON, modos de sitemap y control de subdominios antes de hacer scraping o crawling más profundos.

Web Scraping

Favoritos 0GitHub 234