firecrawl-map

por firecrawl

firecrawl-map ayuda a los agentes a descubrir y listar URLs de un sitio, con opciones de filtrado por búsqueda, límites, salida en JSON, modos de sitemap y control de subdominios antes de hacer scraping o crawling más profundos.

Estrellas234

Favoritos0

Comentarios0

Agregado31 mar 2026

CategoríaWeb Scraping

Comando de instalación

npx skills add firecrawl/cli --skill firecrawl-map

Puntuación editorial

Esta skill obtiene una puntuación de 76/100, lo que la convierte en una candidata sólida para el directorio: los agentes reciben señales de activación claras, ejemplos concretos de CLI y suficiente cobertura de opciones para usarla con menos tanteo que con un prompt genérico. Los usuarios del directorio pueden tomar una decisión de instalación con bastante criterio, aunque conviene esperar una página de skill más bien escueta, con poca guía sobre configuración o casos límite.

76/100

Puntos fuertes

Activación muy sólida: la descripción menciona intenciones de usuario explícitas como “map the site”, “find the URL for” y “list all pages”.
Ejemplos operativos claros que muestran comandos reales tanto para búsquedas dirigidas como para el descubrimiento completo de URLs, incluidos archivos de salida y modo JSON.
Aporta valor dentro de un flujo de trabajo más amplio: sitúa map como un paso dentro de un patrón search → scrape → map → crawl → interact.

Puntos a tener en cuenta

La claridad de instalación y adopción es limitada porque la skill no incluye un comando de instalación ni guía de configuración en `SKILL.md`.
El material de apoyo es mínimo: no hay scripts, referencias, recursos ni orientación explícita sobre restricciones o casos límite.

Firecrawl Cli Scraping Websites Workflow Json

Resumen

Visión general de la skill firecrawl-map

Qué hace firecrawl-map

firecrawl-map es una skill centrada en descubrir URLs dentro de un sitio web. Funciona mejor cuando conoces el dominio pero no la página exacta, o cuando necesitas un inventario rápido de la estructura del sitio antes de hacer scraping, crawling o extracción de contenido.

Quién debería usar la skill firecrawl-map

La skill firecrawl-map encaja especialmente bien para quienes hacen investigación web, descubrimiento de sitios o planificación previa al scraping:

Agentes de IA que necesitan encontrar la página correcta antes de una extracción más profunda
Desarrolladores que están creando flujos de trabajo de web scraping
Investigadores que auditan la huella pública de URLs de un sitio
Operadores que necesitan una lista rápida de URLs sin lanzar un crawl completo

La necesidad real que resuelve

Normalmente, los usuarios no quieren “todas las páginas” como fin en sí mismo. Lo que buscan es responder preguntas como:

“¿Dónde está la documentación de autenticación en este sitio?”
“¿Qué páginas existen bajo este dominio antes de hacer scraping?”
“¿Hay alguna vía rápida basada en sitemap para descubrir URLs?”
“¿Me conviene mapear primero o pasar directamente a crawl?”

Por eso, firecrawl-map for Web Scraping resulta especialmente útil como paso de descubrimiento, no como paso final de extracción de datos.

Por qué la gente elige firecrawl-map

Su principal diferencia está en la velocidad y en el control del alcance. Frente a un prompt genérico como “encuentra la página de docs”, la skill firecrawl-map te da una vía reproducible por CLI para listar URLs, filtrarlas por términos de búsqueda y exportar la salida para pasos posteriores.

Puntos fuertes que se ven en el repositorio:

Uso directo por CLI con firecrawl map
Filtrado opcional con --search para sitios grandes
Salida de inventario de URLs en texto o JSON
Soporte para elegir estrategia de sitemap
Útil como paso intermedio entre la búsqueda y el trabajo de crawl/scrape más profundo

Para qué no sirve

firecrawl-map no es la herramienta adecuada cuando necesitas:

Extracción completa del contenido de las páginas
Navegación interactiva
Scraping estructurado detallado de cada página
Lógica rica de recorrido del sitio más allá del descubrimiento de URLs

En esos casos, mapear es el paso de preparación, no el resultado final.

Cómo usar la skill firecrawl-map

Contexto de instalación de la skill firecrawl-map

Esta skill vive en el repositorio firecrawl/cli, dentro de skills/firecrawl-map. Está pensada para ejecutarse en entornos que puedan correr:

firecrawl *
npx firecrawl *

Si tu agente o tu flujo local puede ejecutar comandos Bash, esta vía de instalación de firecrawl-map suele ser suficiente:

npx firecrawl map "<url>" --limit 100

Si ya tienes Firecrawl CLI disponible de forma global, usa:

firecrawl map "<url>" --limit 100

Lee primero este archivo antes de usarla

Empieza por:

skills/firecrawl-map/SKILL.md

Esta parte del repositorio es pequeña, así que no hay mucho material adicional que revisar. Eso acelera la adopción, pero también implica que conviene ser muy explícito en los prompts sobre dominio, objetivo y formato de salida.

Patrones básicos de uso de firecrawl-map

La skill admite dos modos de uso habituales.

Encontrar una página probable por tema:

firecrawl map "https://example.com" --search "authentication" -o .firecrawl/filtered.txt

Obtener un inventario más amplio de URLs:

firecrawl map "https://example.com" --limit 500 --json -o .firecrawl/urls.json

Este es el patrón central de firecrawl-map usage: empezar de forma acotada con búsqueda si estás tratando de localizar una sola página, o empezar de forma más amplia con una lista limitada de URLs si estás preparando el siguiente paso de scraping.

Qué entradas necesita la skill

Para usar bien la skill firecrawl-map, deja claros estos datos de entrada:

La URL raíz o el dominio
Si necesitas una única página probable o muchas URLs
Una frase de búsqueda, si conoces el tema
El límite deseado de URLs devueltas
El formato de salida: texto plano o JSON
Si deben contarse los subdominios
Cómo tratar los sitemaps

Entrada débil:

“Encuentra la documentación en este sitio”

Entrada sólida:

“Map https://docs.example.com, search for authentication, return top matching URLs as JSON, and include subdomains only if the main docs domain has too few results.”

La versión más sólida reduce las suposiciones y hace evidente qué comando conviene usar.

Cómo convertir una petición vaga en un prompt sólido

Una buena guía de firecrawl-map para redactar prompts es especificar cinco cosas en una sola frase:

sitio
intención
alcance
filtro
salida

Ejemplo:

“Use firecrawl-map on https://example.com to list up to 200 public URLs, prefer sitemap discovery, skip unrelated subdomains, and save JSON output for later scraping.”

Ejemplo para descubrimiento dirigido:

“Use firecrawl-map to find the page on https://example.com most related to pricing API limits, and write matching URLs to a text file.”

Mejor flujo de trabajo: mapear antes de scrape o crawl

Un flujo práctico se ve así:

Usa firecrawl map con --search si intentas localizar una sola página.
Usa firecrawl map con --limit y --json si necesitas un conjunto más amplio de URLs.
Revisa las URLs devueltas.
Selecciona las páginas más relevantes.
Pasa a scrape o crawl solo cuando ya entiendas lo bastante bien la estructura del sitio.

Esto ahorra tiempo y coste frente a hacer scraping a ciegas.

Opciones que cambian de verdad la calidad de la salida

Las opciones más importantes son:

--search <query>: la mejor opción para localizar una página temática en un sitio grande
--limit <n>: evita conjuntos de resultados excesivos
--json: facilita el filtrado posterior y la automatización
--sitemap <include|skip|only>: útil cuando la cobertura del sitemap importa
--include-subdomains: amplía el alcance, pero puede añadir ruido
-o, --output <path>: hace que los resultados se puedan reutilizar en un pipeline

Si los resultados salen con mucho ruido, lo primero que conviene ajustar es la frase de búsqueda, el alcance del dominio y la inclusión de subdominios.

Cómo elegir la estrategia de sitemap

La opción --sitemap importa más de lo que muchos usuarios esperan:

only: la opción más rápida cuando confías en el sitemap del sitio y quieres una cobertura más limpia
include: buen valor por defecto cuando quieres ayuda del sitemap sin depender por completo de él
skip: útil cuando los resultados del sitemap están desactualizados, incompletos o llevan a error

Para sitios de documentación, include u only suelen dar mejores resultados de firecrawl-map for Web Scraping que un descubrimiento sin restricciones.

Cuándo incluir subdominios

Usa --include-subdomains solo si el contenido objetivo puede estar fuera del hostname principal, por ejemplo:

docs.example.com
developers.example.com
support.example.com

No lo actives por defecto en sitios corporativos salvo que realmente quieras una cobertura más amplia. Puede llenar tu lista de URLs con páginas de marketing, soporte o aplicaciones que no tienen relación con tu objetivo.

Ejemplos prácticos que los usuarios sí necesitan

Encontrar una página de login o documentación de autenticación:

firecrawl map "https://docs.example.com" --search "authentication" -o .firecrawl/auth-pages.txt

Obtener un inventario reutilizable de URLs en JSON:

firecrawl map "https://example.com" --limit 300 --json -o .firecrawl/site-map.json

Priorizar descubrimiento solo por sitemap para un sitio de documentación:

firecrawl map "https://docs.example.com" --sitemap only --limit 500 --json

Ampliar el alcance a subdominios cuando no está clara la ubicación de la documentación:

firecrawl map "https://example.com" --search "API reference" --include-subdomains

Bloqueos habituales al adoptar la skill

Las principales dificultades con la skill firecrawl-map no suelen ser de instalación, sino de calidad de la petición:

Empezar con un dominio demasiado amplio
Olvidar añadir --search cuando buscas una sola página
Pedir demasiadas URLs sin fijar un límite
Incluir subdominios demasiado pronto
Tratar map como si fuera una herramienta de extracción de contenido

Si el primer resultado sale desordenado, reduce el alcance del sitio y afina el tema antes de cambiar de herramienta.

Preguntas frecuentes sobre la skill firecrawl-map

¿firecrawl-map es mejor que un prompt normal?

Sí, cuando la tarea es descubrir URLs dentro de un sitio conocido. Un prompt normal puede adivinar páginas probables, pero firecrawl-map te da una forma concreta y repetible de enumerar y filtrar URLs del dominio objetivo.

¿La skill firecrawl-map es buena para principiantes?

Sí, porque la superficie de comandos es pequeña. La forma más sencilla de empezar es con uno de estos dos comandos:

firecrawl map "https://example.com" --search "pricing"

firecrawl map "https://example.com" --limit 100 --json

El error más habitual entre principiantes es pedirle que extraiga contenido de páginas, algo que queda fuera del propósito central de la skill.

¿Cuándo debería usar firecrawl-map en lugar de crawling?

Usa firecrawl-map primero cuando necesites entender la estructura del sitio o localizar páginas candidatas. Recurre al crawling después, cuando necesites un recorrido más amplio o procesamiento a nivel de página una vez terminado el descubrimiento.

¿Cuándo no debería usar firecrawl-map?

Sáltatela si:

Ya conoces la URL exacta
Necesitas texto de la página, metadatos o extracción estructurada
Necesitas interacción de navegador en lugar de un listado de URLs
La tarea no consiste en descubrir la estructura del sitio

¿firecrawl-map funciona bien en sitios grandes?

Sí, pero solo si controlas el alcance. Usa --search, --limit y la estrategia de sitemap de forma deliberada. En sitios grandes es donde firecrawl-map usage más valor aporta, pero también donde los prompts poco precisos generan más ruido.

¿Qué formato de salida debería elegir?

Elige texto plano cuando una persona solo necesite una lista rápida de páginas. Elige --json cuando otra herramienta, script o paso posterior vaya a procesar los resultados.

Cómo mejorar la skill firecrawl-map

Empieza con un objetivo más acotado de lo que crees

La forma más fácil de mejorar los resultados de firecrawl-map es reducir el alcance desde el principio. Si sabes que el contenido probablemente está en la documentación, usa directamente el hostname de docs en lugar de la página principal de la empresa.

Mejor:

https://docs.example.com

Peor:

https://example.com

Usa frases de búsqueda que reflejen la intención de la página

En la skill firecrawl-map, la calidad de la búsqueda importa más que la cantidad de palabras clave. Las frases cortas orientadas a intención suelen funcionar mejor que las consultas recargadas.

Mejor:

authentication
rate limits
API reference

Peor:

where can I find complete developer authentication API reference and login documentation

La versión mejor es más fácil de filtrar por URL y normalmente devuelve coincidencias más limpias.

Elige JSON siempre que los resultados alimenten otro paso

Si el siguiente paso va a ser scrape, filter, classify o deduplicate, usa:

--json

Esta pequeña decisión hace que la guía de firecrawl-map sea mucho más amigable para la automatización y reduce la limpieza manual.

Usa map de forma iterativa, no una sola vez

Un flujo sólido es:

Ejecuta un --search acotado
Inspecciona las URLs más probables
Ejecuta un segundo map sobre el mejor subdominio o sección
Aumenta --limit solo si hace falta
Pasa a scrape/crawl cuando el descubrimiento ya sea estable

Esto funciona mejor que hacer una sola ejecución enorme porque mantiene alta la señal.

Vigila los modos de fallo más comunes

Modos de fallo típicos con firecrawl-map for Web Scraping:

Demasiadas URLs irrelevantes por usar dominios amplios
Páginas objetivo que no aparecen porque los términos de búsqueda son vagos
Inventarios incompletos por depender de la estrategia de sitemap equivocada
Resultados ruidosos por activar subdominios sin necesidad

Cada uno tiene una corrección simple: acotar el sitio, afinar la consulta, cambiar el modo de sitemap o reducir el alcance.

Mejora los prompts especificando criterios de éxito

No pidas solo “todas las URLs”. Di qué consideras un resultado exitoso.

Ejemplo:

“Use firecrawl-map to find pages related to authentication setup on https://docs.example.com. Return the most relevant URLs first, cap at 50, and save JSON output for follow-up scraping.”

Eso deja mucho más claro qué herramienta usar, qué parámetros aplicar y cuándo detenerse.

Mantén una ruta de escalado simple

Usa esta ruta de decisión práctica:

Necesitas una sola página probable: map --search
Necesitas un inventario de URLs: map --limit --json
Necesitas contenido de página: scrape después de map
Necesitas un recorrido más amplio: crawl después de map

Esta es la forma más útil de mejorar los resultados de firecrawl-map sin complicar de más tu flujo de trabajo.

Calificaciones y reseñas

Aún no hay calificaciones

Comparte tu reseña

Inicia sesión para dejar una calificación y un comentario sobre esta skill.

0/10000

Reseñas más recientes

Guardando...

Más skills de esta categoría

huggingface-datasets

por huggingface

Usa la skill huggingface-datasets para flujos de trabajo con la API de Dataset Viewer de Hugging Face: validar datasets, resolver splits, previsualizar y paginar filas, buscar texto, aplicar filtros y obtener enlaces de parquet o estadísticas. Es una guía práctica de huggingface-datasets para exploración de datasets en modo solo lectura.

Web Scraping

Favoritos 0GitHub 10.4k

data-scraper-agent

por affaan-m

data-scraper-agent ayuda a crear un pipeline repetible de datos públicos para web scraping, enriquecimiento y almacenamiento. Está pensado para supervisar trabajos, precios, noticias, repositorios, deportes y listados en un horario definido usando GitHub Actions, con salidas a Notion, Sheets o Supabase. Es ideal para el seguimiento continuo, no para extracciones puntuales.

Web Scraping

Favoritos 0GitHub 156.1k

baoyu-url-to-markdown

por JimLiu

baoyu-url-to-markdown convierte URLs activas a Markdown con un CLI baoyu-fetch incluido en el repositorio, usando Chrome CDP, adaptadores de sitio y una alternativa genérica. Revisa los requisitos de Bun, la configuración inicial de EXTEND.md y el uso para X, YouTube, Hacker News y páginas renderizadas.

Format Conversion

Favoritos 0GitHub 13.2k

x-twitter-scraper

por Xquik-dev

Usa x-twitter-scraper para obtener datos de X (Twitter) y acciones con verificación a través de Xquik. Admite búsqueda de tweets, consulta de usuarios, extracción de seguidores, descarga de medios, monitores, webhooks, MCP y acciones de escritura. Es ideal para investigación estilo web scraping con una API key, no para secretos de inicio de sesión de X.

Web Scraping

Favoritos 0GitHub 71

exa-search

por K-Dense-AI

exa-search es una skill de investigación web impulsada por Exa para encontrar información actual y extraer contenido de URLs. Úsala para búsquedas, descubrimiento de fuentes, extracción de artículos y PDF, e investigación técnica o científica con recuperación semántica, filtrado al estilo académico y una guía clara de instalación y uso.

Web Research

Favoritos 0GitHub 0

browser-use

por browser-use

browser-use es una skill de automatización del navegador para abrir páginas, inspeccionar el estado, hacer clic en elementos indexados, escribir en campos, tomar capturas y reutilizar una sesión persistente del navegador. Úsala para completar formularios con fiabilidad, navegar por sitios y ejecutar flujos con sesión iniciada mediante la CLI de browser-use.

Browser Automation

Favoritos 0GitHub 84.9k

remote-browser

por browser-use

remote-browser ayuda a los agentes en entornos aislados a controlar un navegador sin interfaz para Browser Automation. Úsalo para abrir páginas, inspeccionar el estado, hacer clic en elementos indexados, introducir texto, tomar capturas de pantalla y conectarte a apps locales o a sesiones de navegador compatibles con CDP.

Browser Automation

Favoritos 0GitHub 84.9k

firecrawl

por firecrawl

Skill de firecrawl para instalar, autenticarse y usar la CLI oficial de Firecrawl para scraping web, búsqueda, rastreo e interacción con páginas. Aprende la configuración, `firecrawl --status`, el inicio de sesión, la salida segura de archivos en `.firecrawl/` y patrones de uso prácticos respaldados por el repositorio.

Web Scraping

Favoritos 0GitHub 234

firecrawl-search

por firecrawl

firecrawl-search es una skill de investigación web para encontrar fuentes, realizar búsquedas estructuradas y, opcionalmente, extraer el contenido completo de páginas como JSON con Firecrawl CLI.

Web Research

Favoritos 0GitHub 234

parallel-web

por K-Dense-AI

parallel-web es una skill de investigación y extracción web impulsada por parallel-cli. Ayuda a buscar en la web, extraer contenido de URLs, enriquecer datos a partir de fuentes y realizar investigaciones más profundas, con prioridad para fuentes académicas y científicas. Úsala para el uso de parallel-web, la investigación web, las citas y flujos de trabajo basados en evidencia.

Web Research

Favoritos 0GitHub 0

geomaster

por K-Dense-AI

geomaster es una skill de ciencia geoespacial para flujos de trabajo de SIG, teledetección, análisis espacial y observación de la Tierra. Úsala en tareas de análisis de datos como operaciones raster y vectoriales, procesamiento de imágenes satelitales, métricas espaciales y planificación de flujos de trabajo. La guía de geomaster te ayuda a instalar, revisar y aplicar la skill con menos conjeturas.

Data Analysis

Favoritos 0GitHub 0

asc-aso-audit

por rudrankriyam

asc-aso-audit te ayuda a ejecutar una auditoría ASO offline sobre los metadatos canónicos de App Store en `./metadata`, y luego a detectar brechas de palabras clave con Astro MCP. Usa la skill asc-aso-audit después de `asc metadata pull` para revisar `subtitle`, `keywords`, `description` y `whatsNew` con menos margen de error.

Data Analysis

Favoritos 0GitHub 0

ffuf-web-fuzzing

por jthack

ffuf-web-fuzzing es una habilidad práctica para descubrir contenido web oculto, probar rutas y parámetros, y hacer fuzzing de objetivos autenticados con solicitudes en bruto, auto-calibración y análisis de resultados. Encaja con testers de seguridad que necesitan una guía repetible de ffuf-web-fuzzing para pruebas de penetración y flujos de trabajo de auditoría de seguridad.

Security Audit

Favoritos 0GitHub 0

web-to-markdown

por softaworks

web-to-markdown es una skill de conversión de formato que transforma páginas web en vivo en Markdown limpio mediante el CLI local `web2md`, usando un navegador de la familia Chromium para páginas renderizadas con JS, flujos interactivos y conversión por lotes de URLs. Solo se ejecuta cuando se invoca explícitamente por nombre.

Format Conversion

Favoritos 0GitHub 1.3k

firecrawl-agent

por firecrawl

firecrawl-agent ayuda a extraer JSON estructurado de sitios web complejos y de varias páginas. Descubre cuándo conviene usarlo, cómo ejecutar el agente de Firecrawl CLI, añadir esquemas, definir URLs iniciales y guardar resultados para extraer precios, productos y datos tipo directorio.

Web Scraping

Favoritos 0GitHub 234

firecrawl-crawl

por firecrawl

firecrawl-crawl ayuda a los agentes a extraer contenido de forma masiva de un sitio web o una sección de documentación, con filtros de rutas, límites de profundidad, topes de páginas, modo de espera y comprobaciones del estado del trabajo.

Web Scraping

Favoritos 0GitHub 234