firecrawl-download

por firecrawl

firecrawl-download ajuda você a baixar um site ou uma seção de documentação em arquivos locais organizados dentro de .firecrawl/. Combina mapeamento do site e scraping, oferece suporte a markdown, links e capturas de tela, e é útil para manter cópias offline da documentação, capturar páginas em massa e viabilizar fluxos práticos de Web Scraping.

Estrelas234

Favoritos0

Comentários0

Adicionado31 de mar. de 2026

CategoriaWeb Scraping

Comando de instalação

npx skills add firecrawl/cli --skill firecrawl-download

Pontuação editorial

Esta skill recebe 73/100, o que significa que pode ser listada para usuários do diretório: o gatilho de uso é claro e o fluxo é real, mas a adoção ainda exige alguma tentativa e interpretação, porque o repositório oferece apenas um único SKILL.md com poucos detalhes operacionais além de exemplos de comandos.

73/100

Pontos fortes

Bom potencial de acionamento: a descrição cita intenções concretas do usuário, como "baixar o site", "cópia offline" e "baixar toda a documentação".
Valor prático para agentes: combina mapeamento do site e scraping em um único comando e documenta opções úteis, como formatos, screenshots, include-paths e limites.
Exemplos razoavelmente acionáveis: o SKILL.md inclui comandos de início rápido e indica explicitamente o uso de `-y` para pular prompts de confirmação.

Pontos de atenção

A profundidade operacional é limitada: não há arquivos de suporte, referências, instruções de instalação ou regras de decisão para lidar com falhas, limites de escala ou gerenciamento da saída.
A skill está marcada explicitamente como experimental, o que aumenta o risco de confiança e estabilidade em fluxos de agentes com perfil de produção.

Firecrawl Cli Scraping Websites Offline Markdown

Visão geral

Visão geral da skill firecrawl-download

O que a firecrawl-download faz

A skill firecrawl-download foi feita para uma tarefa bem específica: baixar um site ou uma seção de documentação em arquivos locais organizados. Ela combina descoberta do site com scraping de páginas e depois salva cada página em .firecrawl/ como markdown, screenshots ou múltiplos formatos de saída por página.

Isso é especialmente útil se você quer uma cópia offline da documentação, um corpus local para pesquisa ou uma forma repetível de salvar páginas em lote para análise posterior. Em comparação com um prompt genérico de scraping, firecrawl-download oferece um caminho mais claro para capturar um site inteiro, em vez de fazer você montar um fluxo de crawl do zero.

Quem deve usar esta skill firecrawl-download

Os perfis com melhor encaixe são:

desenvolvedores que querem salvar documentação localmente
pesquisadores coletando conteúdo de sites para revisão
equipes montando um arquivo leve de conteúdo
agentes que precisam de um fluxo prático de “baixar este site” com menos tentativa e erro

Se o seu objetivo real é “salvar este site como arquivos locais utilizáveis”, esta skill faz mais sentido do que um prompt amplo de web scraping.

O que costuma pesar antes de instalar

A decisão de instalar firecrawl-download normalmente gira em torno de quatro perguntas:

Ela consegue lidar com um site inteiro ou com uma seção de docs, e não só com uma página?
Ela salva a saída em uma estrutura local realmente útil?
Ela permite filtrar o escopo para você não baixar páginas erradas?
Ela suporta múltiplos tipos de saída, como markdown e screenshots?

Pelo que aparece no código da skill, a resposta para as quatro é sim. A principal ressalva é que ela está marcada como experimental, então vale tratá-la como um fluxo de conveniência, não como um sistema de arquivamento profundamente robusto.

Diferencial principal para fluxos de Web Scraping

O diferencial de firecrawl-download for Web Scraping não é apenas força bruta de scraping. O ponto é que o comando já empacota:

mapeamento do site primeiro
scraping depois
saída em arquivos por página
diretórios locais aninhados
reaproveitamento das opções de scrape durante o download

Isso torna a instalação mais interessante para casos de “baixar docs” do que um comando simples de scrape que apenas devolve o conteúdo da página.

Como usar a skill firecrawl-download

Contexto de instalação da firecrawl-download

Os indícios no repositório mostram que esta skill fica em firecrawl/cli, dentro de skills/firecrawl-download. Um caminho prático de instalação é:

npx skills add https://github.com/firecrawl/cli --skill firecrawl-download

Depois de adicionar, confira:

skills/firecrawl-download/SKILL.md

Esta skill tem poucos arquivos de apoio, então SKILL.md é a principal fonte de verdade.

Leia este arquivo primeiro

Comece por:

skills/firecrawl-download/SKILL.md

Esse arquivo deixa claro rapidamente o escopo real: firecrawl download é um comando experimental de conveniência que combina map e scrape, salva os resultados em .firecrawl/ e aceita opções de scrape durante o download.

Uso básico da firecrawl-download

A forma mais rápida de usar a firecrawl-download skill é apontá-la para a raiz de uma documentação ou área de conteúdo:

firecrawl download https://docs.example.com

Para execuções sem supervisão, a própria skill recomenda:

firecrawl download https://docs.example.com -y

Use -y sempre que quiser pular confirmações em fluxos agentic ou scripts automatizados.

Quais entradas a skill precisa para funcionar bem

Um pedido vago como “baixe este site” costuma ser fraco demais. Entradas melhores incluem:

a URL raiz
os limites da seção que você realmente quer
número máximo de páginas
formatos de saída necessários
se screenshots importam
o que deve ser excluído

Um pedido mais forte seria:

“Use firecrawl-download para salvar https://docs.example.com localmente em markdown com screenshots, inclua apenas /guides e /api, limite a 50 páginas e pule páginas traduzidas.”

Isso dá à skill informação suficiente para mapear o escopo certo antes de fazer o scraping.

Comandos que mais importam na prática

O código da skill mostra alguns padrões de alto valor:

# With screenshots
firecrawl download https://docs.example.com --screenshot --limit 20 -y

# Multiple formats per page
firecrawl download https://docs.example.com --format markdown,links --screenshot --limit 20 -y

# Filter by section
firecrawl download https://docs.example.com --include-paths "/features,/sdks"

Esses exemplos importam porque refletem bloqueios reais de adoção: conteúdo demais, seções erradas ou fidelidade de saída insuficiente.

O que é gravado localmente

A skill salva a saída em diretórios aninhados dentro de .firecrawl/. Quando você pede múltiplos formatos, cada página pode gerar arquivos separados, como:

index.md
links.txt
screenshot.png

Essa organização local dos arquivos é um dos principais motivos para optar pela instalação de firecrawl-download em vez de usar um prompt pontual de scrape.

Como transformar um objetivo vago em um prompt utilizável

Se a sua primeira ideia for:

“baixar este site de docs”

reescreva como:

URL de destino
filtros de seção desejados
formatos de arquivo
screenshot sim/não
limite de páginas
exclusões necessárias

Exemplo de prompt para um agente:

“Use a skill firecrawl-download para baixar https://docs.example.com para uso offline. Salve em markdown com screenshots, inclua apenas /getting-started,/api, limite a 30 páginas e use -y para que a execução seja não interativa.”

Isso funciona melhor porque elimina ambiguidades sobre escopo e formato de saída.

Fluxo sugerido para resultados mais confiáveis

Um fluxo prático de firecrawl-download guide é:

Comece pela menor seção de docs que ainda seja útil.
Adicione --include-paths antes de aumentar a quantidade de páginas.
Execute com --limit na primeira passada.
Verifique a estrutura de saída em .firecrawl/.
Só adicione --screenshot ou múltiplos formatos se você realmente precisar.
Expanda o crawl depois que a primeira amostra estiver correta.

Isso evita a falha mais comum: baixar conteúdo demais, cedo demais.

Quando usar firecrawl-download em vez de um scrape normal

Use firecrawl-download usage quando você precisar de:

muitas páginas, e não apenas uma
arquivos locais, e não só texto retornado
uma cópia offline navegável
um snapshot rápido de docs para revisão ou referência

Use um scrape comum quando você só precisar de uma página ou de uma lógica de extração altamente personalizada. O valor de firecrawl-download está na velocidade do fluxo para salvar conteúdo em escala de site.

Restrições e trade-offs que vale conhecer cedo

As principais limitações práticas visíveis no código da skill são:

ela está marcada como experimental
ela é otimizada como um comando de conveniência
a qualidade da saída ainda depende da estrutura do site alvo e dos seus filtros de escopo
execuções amplas, sem limites, podem gerar ruído ou excesso de conteúdo

Então a skill é uma ótima opção para downloads controlados de documentação, mas não garante arquivamento perfeito ou completo.

FAQ da skill firecrawl-download

A firecrawl-download é boa para iniciantes?

Sim, especialmente se a sua tarefa for simplesmente “salvar docs localmente”. Os exemplos de comando são diretos, e o assistente interativo ajuda. Ainda assim, iniciantes devem começar com um --limit pequeno e --include-paths mais restritos para evitar downloads grandes demais.

Qual é a diferença real para um prompt genérico de scraping com IA?

Um prompt genérico pode descrever a tarefa, mas firecrawl-download já embute o padrão útil: mapear o site, fazer scrape de cada página e salvar os arquivos em diretórios. Isso reduz o atrito de configuração e torna o fluxo mais repetível.

A firecrawl-download serve só para sites de documentação?

Não, mas documentação é o encaixe mais óbvio. Ela funciona melhor em sites cuja estrutura de páginas e caminhos seja razoavelmente previsível. Sites muito dinâmicos ou mal delimitados podem exigir mais filtros ou outra abordagem.

A firecrawl-download consegue salvar mais do que markdown?

Sim. O código da skill mostra explicitamente múltiplos formatos por página e screenshots opcionais. Isso é importante se você precisa tanto de texto legível quanto de registro visual de apoio.

Quando eu não devo usar firecrawl-download?

Evite firecrawl-download se você só precisa de:

uma única página
um esquema de extração customizado
pós-processamento profundo durante o scraping
um pipeline de arquivamento totalmente robusto, com garantias mais rígidas

Nesses casos, um comando de scrape mais específico ou um fluxo mais customizado pode ser a melhor escolha.

Como melhorar a skill firecrawl-download

Dê à firecrawl-download um escopo mais fechado primeiro

A forma mais fácil de melhorar os resultados de firecrawl-download é reduzir a ambiguidade. Use:

--include-paths
--limit
uma URL raiz de docs bem definida

Uma execução de 20 páginas com escopo controlado costuma ser mais útil do que uma varredura irrestrita do site inteiro.

Escolha as saídas com base no trabalho real que vem depois

Não peça todos os formatos por padrão. Escolha os formatos de acordo com a próxima etapa:

markdown para leitura, busca e ingestão por LLM
links quando a estrutura importa
--screenshot quando layout ou evidência de UI importam

Isso deixa a execução mais leve e a revisão da saída mais simples.

Faça uma execução de amostra antes do download completo

Um padrão forte de iteração é:

firecrawl download https://docs.example.com --include-paths "/api" --limit 10 -y

Revise os arquivos salvos e só depois expanda para mais seções ou limites maiores. Isso ajuda a detectar cedo decisões ruins de escopo.

Falhas comuns e como evitá-las com firecrawl-download

Os problemas mais típicos são:

baixar as seções erradas
coletar páginas demais
esquecer -y em execuções automatizadas
pedir saídas que você não precisa de fato

A correção é simples: especifique o escopo, limite a primeira execução e escolha os formatos de forma intencional.

Como melhorar a qualidade do prompt em uso com agentes

Se um agente vai chamar a skill, peça:

URL inicial exata
finalidade desejada da saída local
seções a incluir
seções a evitar
formatos de saída
limite de tamanho da execução

Bom prompt:

“Use firecrawl-download para criar uma cópia offline em markdown de https://docs.example.com, apenas para /guides e /reference, com screenshots de cada página, limitado a 40 páginas e salvo de forma não interativa.”

Isso produz uma execução melhor do que “baixe a documentação”.

Como iterar depois da primeira saída

Depois da primeira passada, avalie:

.firecrawl/ trouxe as páginas que você esperava?
Houve páginas irrelevantes demais?
Você precisava de screenshots ou só de texto?
A próxima execução deve ampliar ou restringir os include paths?

A melhor forma de melhorar a firecrawl-download skill não é repetir a execução às cegas, e sim ajustar escopo e formatos de saída com base no que o primeiro lote realmente gerou.

Avaliações e comentários

Ainda não há avaliações

Compartilhe sua avaliação

Faça login para deixar uma nota e um comentário sobre esta skill.

0/10000

Avaliações mais recentes

Salvando...

Mais skills nesta categoria

huggingface-datasets

por huggingface

Use a skill huggingface-datasets para fluxos de trabalho da API do Dataset Viewer do Hugging Face: validar datasets, resolver splits, pré-visualizar e paginar linhas, buscar texto, aplicar filtros e obter links de parquet ou estatísticas. É um guia prático de huggingface-datasets para exploração somente leitura de datasets.

Web Scraping

Favoritos 0GitHub 10.4k

data-scraper-agent

por affaan-m

data-scraper-agent ajuda a montar um pipeline repetível de dados públicos para raspagem web, enriquecimento e armazenamento. Ele foi pensado para monitorar jobs, preços, notícias, repositórios, esportes e anúncios em uma agenda usando GitHub Actions, com saídas para Notion, Sheets ou Supabase. É mais indicado para acompanhamento contínuo do que para extrações pontuais.

Web Scraping

Favoritos 0GitHub 156.1k

baoyu-url-to-markdown

por JimLiu

baoyu-url-to-markdown converte URLs ativas em Markdown com uma CLI baoyu-fetch vendorizada, usando Chrome CDP, adaptadores de sites e fallback genérico. Veja os requisitos de runtime com Bun, a configuração inicial do EXTEND.md e como usar a skill com X, YouTube, Hacker News e páginas renderizadas.

Format Conversion

Favoritos 0GitHub 13.2k

x-twitter-scraper

por Xquik-dev

Use o x-twitter-scraper para recuperar dados do X (Twitter) e executar ações com confirmação via Xquik. Ele oferece suporte a busca de tweets, consulta de usuários, extração de seguidores, download de mídia, monitores, webhooks, MCP e ações de gravação. É mais indicado para pesquisa no estilo web scraping com chave de API, não para segredos de login do X.

Web Scraping

Favoritos 0GitHub 71

exa-search

por K-Dense-AI

exa-search é uma skill de pesquisa na web, powered by Exa, para encontrar informações atuais e extrair conteúdo de URLs. Use para busca, descoberta de fontes, extração de artigos e PDFs e pesquisa técnica ou científica com recuperação semântica, filtros no estilo acadêmico e orientação clara de instalação e uso.

Web Research

Favoritos 0GitHub 0

browser-use

por browser-use

browser-use é uma skill de automação de navegador para abrir páginas, inspecionar o estado, clicar em elementos indexados, preencher campos, tirar capturas de tela e reutilizar uma sessão persistente do navegador. Use para preencher formulários com mais confiabilidade, navegar e executar fluxos com login usando a CLI do browser-use.

Browser Automation

Favoritos 0GitHub 84.9k

remote-browser

por browser-use

remote-browser ajuda agentes em sandbox a controlar um navegador headless para automação de navegador. Use para abrir páginas, inspecionar o estado, clicar em elementos indexados, preencher campos, tirar capturas de tela e conectar-se a apps locais ou sessões de navegador com CDP.

Browser Automation

Favoritos 0GitHub 84.9k

firecrawl

por firecrawl

Skill firecrawl para instalar, autenticar e usar a CLI oficial do Firecrawl para web scraping, busca, crawling e interação com páginas. Veja como configurar, usar `firecrawl --status`, fazer login, salvar saídas com segurança em `.firecrawl/` e aplicar padrões práticos de uso respaldados pelo repositório.

Web Scraping

Favoritos 0GitHub 234

firecrawl-search

por firecrawl

firecrawl-search é uma skill de pesquisa na web para encontrar fontes, fazer buscas estruturadas e, opcionalmente, extrair o conteúdo completo de páginas em JSON com o Firecrawl CLI.

Web Research

Favoritos 0GitHub 234

parallel-web

por K-Dense-AI

parallel-web é uma skill de pesquisa e extração na web, potencializada pelo parallel-cli. Ela ajuda você a pesquisar na web, extrair conteúdo de URLs, enriquecer dados a partir de fontes e conduzir pesquisas mais profundas, com prioridade para fontes acadêmicas e científicas. Use-a para uso do parallel-web, pesquisa na web, citações e fluxos de trabalho orientados por evidências.

Web Research

Favoritos 0GitHub 0

geomaster

por K-Dense-AI

geomaster é uma skill de ciência geoespacial para GIS, sensoriamento remoto, análise espacial e fluxos de trabalho de observação da Terra. Use-a em tarefas de Análise de Dados como operações com raster e vetor, processamento de imagens de satélite, métricas espaciais e planejamento de workflows. O guia do geomaster ajuda você a instalar, inspecionar e aplicar a skill com menos suposições.

Data Analysis

Favoritos 0GitHub 0

asc-aso-audit

por rudrankriyam

O asc-aso-audit ajuda você a fazer uma auditoria de ASO offline nos metadados canônicos da App Store em `./metadata` e, em seguida, identificar lacunas de palavras-chave com o Astro MCP. Use a skill asc-aso-audit depois de `asc metadata pull` para revisar `subtitle`, `keywords`, `description` e `whatsNew` com menos tentativa e erro.

Data Analysis

Favoritos 0GitHub 0

ffuf-web-fuzzing

por jthack

ffuf-web-fuzzing é uma skill prática para descobrir conteúdo oculto em sites, testar rotas e parâmetros e fazer fuzzing de alvos autenticados com requisições brutas, auto-calibração e análise de resultados. É ideal para profissionais de teste de segurança que precisam de um guia repetível de ffuf-web-fuzzing para pentests e fluxos de trabalho de auditoria de segurança.

Security Audit

Favoritos 0GitHub 0

web-to-markdown

por softaworks

web-to-markdown é uma skill de conversão de formato que transforma páginas web ao vivo em Markdown limpo por meio do CLI local `web2md`, usando um navegador da família Chromium para páginas renderizadas por JS, fluxos interativos e conversão em lote de URLs. Ela só é executada quando é chamada explicitamente pelo nome.

Format Conversion

Favoritos 0GitHub 1.3k

firecrawl-agent

por firecrawl

O firecrawl-agent ajuda a extrair JSON estruturado de sites complexos com várias páginas. Entenda quando usar, como executar o agente Firecrawl CLI, adicionar schemas, definir URLs iniciais e salvar saídas para extração de preços, produtos e dados em estilo diretório.

Web Scraping

Favoritos 0GitHub 234

firecrawl-map

por firecrawl

A firecrawl-map ajuda agentes a descobrir e listar URLs de um site, com opções de filtro por busca, limites, saída em JSON, modos de sitemap e controle de subdomínios antes de um scraping ou crawling mais aprofundado.

Web Scraping

Favoritos 0GitHub 234