firecrawl-download

작성자 firecrawl

firecrawl-download는 사이트나 문서 섹션을 `.firecrawl/` 아래의 정리된 로컬 파일로 저장할 수 있게 해주는 스킬입니다. 사이트 맵핑과 스크래핑을 함께 수행하며, markdown, 링크, 스크린샷을 지원합니다. 오프라인 문서 사본 생성, 여러 페이지 일괄 수집, 실무형 Web Scraping 워크플로에 유용합니다.

Stars234

즐겨찾기0

추가됨2026년 3월 31일

카테고리Web Scraping

설치 명령어

npx skills add firecrawl/cli --skill firecrawl-download

큐레이션 점수

이 스킬은 73/100점으로, 디렉터리 사용자에게 노출할 만한 수준입니다. 실행 트리거는 분명하고 워크플로도 실제로 쓸 만하지만, 저장소에 명령 예시 외 운영 정보가 제한적인 단일 `SKILL.md`만 있어 도입 시에는 어느 정도 추정이 필요합니다.

73/100

강점

트리거가 명확합니다. 설명에 "download the site", "offline copy", "download all the docs"처럼 구체적인 사용자 의도가 직접 드러납니다.
에이전트 활용 가치가 실제적입니다. 사이트 맵핑과 스크래핑을 하나의 명령으로 결합하고, formats, screenshots, include-paths, limits 같은 유용한 옵션도 문서화되어 있습니다.
예시의 실행 가능성이 충분합니다. `SKILL.md`에 빠른 시작용 명령 예시가 포함되어 있고, 확인 프롬프트를 건너뛰기 위해 `-y`를 사용한다고 명시합니다.

주의점

운영 관점의 깊이는 제한적입니다. 지원 파일, 참고 자료, 설치 안내는 물론 실패 처리, 규모 한계, 출력물 관리에 대한 판단 기준도 제공되지 않습니다.
이 스킬은 experimental로 명시되어 있어, 프로덕션 성격의 에이전트 워크플로에는 신뢰성과 안정성 측면의 리스크가 있습니다.

Firecrawl Cli Scraping Websites Offline Markdown

개요

firecrawl-download 스킬 개요

firecrawl-download가 하는 일

firecrawl-download 스킬은 한 가지 작업에 특화되어 있습니다. 웹사이트나 문서 섹션을 구조화된 로컬 파일로 내려받는 일입니다. 사이트 탐색과 페이지 스크래핑을 결합한 뒤, 각 페이지를 .firecrawl/ 아래에 markdown, 스크린샷, 또는 페이지별 여러 출력 형식으로 저장합니다.

오프라인 문서 사본이 필요하거나, 로컬 리서치 코퍼스를 만들고 싶거나, 나중에 분석할 페이지를 반복 가능한 방식으로 대량 저장하려는 경우 특히 유용합니다. 일반적인 스크래핑 프롬프트와 비교하면 firecrawl-download는 전체 사이트 수집에 더 적합한 흐름을 제공하므로, 크롤링 워크플로를 처음부터 직접 설계할 필요가 줄어듭니다.

어떤 사용자에게 firecrawl-download 스킬이 잘 맞나

특히 잘 맞는 사용자는 다음과 같습니다.

문서를 로컬에 저장하려는 개발자
검토용으로 사이트 콘텐츠를 수집하는 리서처
가벼운 콘텐츠 아카이브를 구축하는 팀
추측을 줄이고 실용적인 “이 사이트를 다운로드해” 워크플로가 필요한 에이전트

실제 목표가 “이 사이트를 활용 가능한 로컬 파일로 저장하는 것”이라면, 이 스킬은 범용 웹 스크래핑 프롬프트보다 더 잘 맞습니다.

설치 전에 사용자가 가장 궁금해하는 점

firecrawl-download 설치를 결정할 때는 보통 아래 네 가지가 핵심입니다.

한 페이지가 아니라 사이트 전체나 문서 섹션 전체를 다룰 수 있는가?
결과물을 실제로 쓰기 좋은 로컬 구조로 저장하는가?
원치 않는 페이지를 받지 않도록 범위를 필터링할 수 있는가?
markdown과 스크린샷처럼 여러 출력 형식을 지원하는가?

스킬 소스를 기준으로 보면 네 가지 모두 그렇다고 볼 수 있습니다. 다만 가장 중요한 단서는 experimental로 표시되어 있다는 점입니다. 즉, 견고한 아카이브 시스템이라기보다 편의성 높은 다운로드 워크플로로 보는 것이 맞습니다.

Web Scraping 워크플로에서의 핵심 차별점

firecrawl-download for Web Scraping의 차별점은 단순한 스크래핑 성능 자체만이 아닙니다. 이 명령은 다음을 한 번에 묶어 제공합니다.

먼저 사이트 맵핑
그다음 스크래핑
페이지별 파일 출력
중첩된 로컬 디렉터리
다운로드 중에도 scrape 옵션 재사용 가능

이 점 때문에 페이지 내용만 반환하는 단순 scrape 명령보다, “문서를 통째로 다운로드”하는 용도에서 firecrawl-download의 설치 가치가 더 분명합니다.

firecrawl-download 스킬 사용 방법

firecrawl-download 설치 맥락

저장소 기준으로 이 스킬은 firecrawl/cli의 skills/firecrawl-download 아래에 있습니다. 실용적인 설치 경로는 다음과 같습니다.

npx skills add https://github.com/firecrawl/cli --skill firecrawl-download

추가한 뒤에는 다음 파일을 확인하세요.

skills/firecrawl-download/SKILL.md

이 스킬은 보조 파일이 거의 없기 때문에, SKILL.md가 사실상 핵심 기준 문서입니다.

먼저 읽어야 할 파일

가장 먼저 볼 파일은 다음입니다.

skills/firecrawl-download/SKILL.md

이 파일을 보면 실제 범위를 빠르게 파악할 수 있습니다. firecrawl download는 map과 scrape를 결합한 실험적 편의 명령이며, 결과를 .firecrawl/ 아래에 저장하고, 다운로드 중에도 scrape 옵션을 지원한다는 점이 명확히 드러납니다.

기본적인 firecrawl-download 사용법

firecrawl-download skill을 가장 빠르게 활용하는 방법은 문서 루트나 콘텐츠 루트를 지정하는 것입니다.

firecrawl download https://docs.example.com

무인 실행이 필요하다면, 스킬은 다음 사용법을 명시적으로 권장합니다.

firecrawl download https://docs.example.com -y

에이전트 기반 실행이나 스크립트 워크플로에서 확인 프롬프트를 건너뛰고 싶다면 -y를 쓰는 것이 좋습니다.

스킬이 제대로 작동하려면 어떤 입력이 필요한가

“이 사이트 다운로드해” 같은 대충의 요청은 대개 너무 약합니다. 더 좋은 입력은 다음을 포함합니다.

루트 URL
실제로 포함할 섹션 경계
최대 페이지 수
필요한 출력 형식
스크린샷 필요 여부
제외할 대상

더 강한 요청의 예시는 다음과 같습니다.

“Use firecrawl-download to save https://docs.example.com locally as markdown with screenshots, include only /guides and /api, limit to 50 pages, and skip translated pages.”

이 정도는 되어야 스킬이 스크래핑 전에 올바른 범위를 맵핑할 수 있습니다.

실무에서 특히 중요한 명령 패턴

소스에는 실제 활용도가 높은 패턴이 몇 가지 나옵니다.

# With screenshots
firecrawl download https://docs.example.com --screenshot --limit 20 -y

# Multiple formats per page
firecrawl download https://docs.example.com --format markdown,links --screenshot --limit 20 -y

# Filter by section
firecrawl download https://docs.example.com --include-paths "/features,/sdks"

이 예시들이 중요한 이유는 실제 도입 과정에서 자주 막히는 지점을 그대로 다루기 때문입니다. 콘텐츠가 너무 많거나, 잘못된 섹션을 받거나, 출력 충실도가 부족한 문제가 대표적입니다.

로컬에 어떤 형태로 저장되는가

이 스킬은 .firecrawl/ 아래의 중첩 디렉터리에 결과를 저장합니다. 여러 형식을 요청하면 각 페이지마다 다음과 같은 별도 파일이 생성될 수 있습니다.

index.md
links.txt
screenshot.png

이런 로컬 파일 구조는 일회성 scrape 프롬프트 대신 firecrawl-download install을 선택해야 하는 주된 이유 중 하나입니다.

모호한 목표를 실제로 쓸 수 있는 프롬프트로 바꾸는 법

처음 생각이 다음처럼 막연하다면

“이 문서 사이트 다운로드해”

아래처럼 다시 써보는 것이 좋습니다.

대상 URL
원하는 섹션 필터
파일 형식
스크린샷 필요 여부
페이지 수 제한
제외 조건

에이전트용 프롬프트 예시는 다음과 같습니다.

“Use the firecrawl-download skill to download https://docs.example.com for offline use. Save as markdown plus screenshots, include only /getting-started,/api, cap at 30 pages, and use -y so the run is non-interactive.”

이 방식이 더 잘 작동하는 이유는 범위와 출력에 대한 모호성을 없애주기 때문입니다.

안정적인 결과를 위한 권장 워크플로

실전에서 쓸 만한 firecrawl-download guide 워크플로는 다음과 같습니다.

가장 작은 유효 문서 섹션부터 시작합니다.
페이지 수를 늘리기 전에 --include-paths를 먼저 추가합니다.
첫 실행은 --limit를 걸고 진행합니다.
.firecrawl/ 출력 구조를 확인합니다.
정말 필요할 때만 --screenshot이나 다중 형식을 추가합니다.
첫 샘플이 올바르게 나왔을 때만 크롤 범위를 넓힙니다.

이렇게 하면 너무 많은 콘텐츠를 너무 이르게 내려받는 흔한 실패를 피할 수 있습니다.

일반 scrape 대신 firecrawl-download를 써야 하는 경우

다음이 필요하다면 firecrawl-download usage가 더 적합합니다.

한 페이지가 아니라 여러 페이지
반환 텍스트가 아니라 로컬 파일
탐색 가능한 오프라인 사본
검토나 참고용으로 빠르게 만든 문서 스냅샷

반대로 한 페이지만 필요하거나, 추출 로직을 매우 세밀하게 커스터마이즈해야 한다면 일반 scrape가 더 낫습니다. firecrawl-download의 가치는 사이트 단위 저장을 빠르게 처리하는 워크플로 속도에 있습니다.

초기에 알아야 할 제약과 트레이드오프

스킬 소스를 기준으로 한 가장 실질적인 제약은 다음과 같습니다.

experimental로 표시되어 있음
편의성 중심 명령으로 최적화되어 있음
출력 품질은 대상 사이트 구조와 범위 필터 설정에 여전히 크게 좌우됨
제한 없는 광범위 실행은 노이즈가 많거나 과도해질 수 있음

즉, 이 스킬은 통제된 문서 다운로드에는 강하지만, 완벽한 아카이브 완전성을 보장하는 도구로 보기는 어렵습니다.

firecrawl-download 스킬 FAQ

firecrawl-download는 초보자에게도 괜찮은가?

그렇습니다. 특히 작업이 단순히 “문서를 로컬에 저장”하는 것이라면 더 그렇습니다. 명령 예시는 비교적 직관적이고, 대화형 가이드도 도움이 됩니다. 다만 초보자라면 과도한 다운로드를 피하기 위해 작은 --limit와 좁은 --include-paths부터 시작하는 편이 안전합니다.

범용 AI 스크래핑 프롬프트와의 실제 차이는 무엇인가?

범용 프롬프트로도 작업 설명은 가능하지만, firecrawl-download는 이미 유용한 패턴을 내장하고 있습니다. 즉, 사이트를 맵핑하고, 각 페이지를 스크래핑하고, 파일을 디렉터리에 저장하는 흐름이 기본 포함되어 있습니다. 덕분에 초기 설정 부담이 줄고, 워크플로 반복 가능성도 더 높습니다.

firecrawl-download는 문서 사이트 전용인가?

아닙니다. 다만 문서 사이트가 가장 명확한 적합 대상입니다. 페이지 구조와 경로가 어느 정도 예측 가능한 사이트에서 가장 잘 작동합니다. 동적 요소가 많거나 범위를 잡기 어려운 사이트라면 더 많은 필터링이 필요하거나, 아예 다른 접근이 더 적합할 수 있습니다.

firecrawl-download는 markdown 말고도 저장할 수 있나?

그렇습니다. 스킬 소스에는 페이지별 다중 형식 출력과 선택적 스크린샷이 명시되어 있습니다. 읽기 좋은 텍스트와 시각적 캡처를 함께 확보해야 할 때 특히 중요합니다.

어떤 경우에는 firecrawl-download를 쓰지 않는 편이 좋은가?

다음만 필요하다면 firecrawl-download는 건너뛰는 편이 낫습니다.

한 페이지
커스텀 추출 스키마
스크래핑 시점의 깊은 후처리
더 엄격한 보장이 필요한 견고한 아카이브 파이프라인

이런 경우에는 더 좁은 scrape 명령이나 맞춤형 워크플로가 더 잘 맞을 수 있습니다.

firecrawl-download 스킬을 더 잘 활용하는 방법

먼저 firecrawl-download 범위를 더 타이트하게 잡기

firecrawl-download 결과를 개선하는 가장 쉬운 방법은 모호성을 줄이는 것입니다. 다음을 적극적으로 사용하세요.

--include-paths
--limit
명확한 문서 루트 URL

통제되지 않은 전체 사이트 실행보다, 범위를 제한한 20페이지 실행이 대체로 훨씬 유용합니다.

실제 후속 작업에 맞춰 출력 형식 선택하기

기본적으로 모든 형식을 요청하지 마세요. 다음 단계에 맞는 형식만 고르는 편이 낫습니다.

markdown: 읽기, 검색, LLM 입력용
links: 구조 파악이 중요할 때
--screenshot: 레이아웃이나 UI 근거가 중요할 때

이렇게 해야 실행이 가벼워지고 결과 검토도 쉬워집니다.

전체 다운로드 전에 샘플 실행 먼저 하기

권장되는 반복 패턴은 다음과 같습니다.

firecrawl download https://docs.example.com --include-paths "/api" --limit 10 -y

저장된 파일을 검토한 뒤 더 많은 섹션이나 더 높은 제한으로 확장하세요. 이렇게 하면 잘못된 범위 설정을 초기에 잡아낼 수 있습니다.

자주 발생하는 실패 패턴과 피하는 법

대표적인 문제는 다음과 같습니다.

잘못된 섹션을 다운로드함
페이지를 너무 많이 수집함
자동화 실행에서 -y를 빼먹음
실제로 필요하지 않은 출력 형식을 요청함

해결법은 단순합니다. 범위를 명확히 지정하고, 첫 실행에는 제한을 두고, 출력 형식은 의도적으로 선택하면 됩니다.

에이전트 기반 사용에서는 프롬프트 품질 높이기

에이전트가 스킬을 호출한다면 다음 정보를 요청에 포함하세요.

정확한 시작 URL
원하는 로컬 출력의 목적
포함할 섹션
피할 섹션
출력 형식
실행 크기 제한

좋은 프롬프트 예시는 다음과 같습니다.

“Use firecrawl-download to create an offline markdown copy of https://docs.example.com, only for /guides and /reference, with screenshots for each page, limited to 40 pages, and save non-interactively.”

이런 요청이 “문서 다운로드해”보다 훨씬 안정적으로 실행됩니다.

첫 결과 이후에는 어떻게 반복 개선할까

첫 실행이 끝난 뒤에는 다음을 점검하세요.

.firecrawl/에 기대한 페이지가 들어 있었는가?
불필요한 페이지가 너무 많지 않았는가?
스크린샷이 정말 필요했는가, 아니면 텍스트만으로 충분했는가?
다음 실행에서는 include paths를 넓혀야 하는가, 더 좁혀야 하는가?

firecrawl-download skill을 개선하는 가장 좋은 방법은 무작정 다시 돌리는 것이 아니라, 첫 결과물이 실제로 무엇을 생성했는지 보고 범위와 출력 선택을 조정하는 것입니다.

평점 및 리뷰

아직 평점이 없습니다

리뷰 남기기

이 스킬의 평점과 리뷰를 남기려면 로그인하세요.

0/10000

최신 리뷰

저장 중...

이 카테고리의 다른 스킬

huggingface-datasets

작성자 huggingface

Hugging Face Dataset Viewer API 작업에 이 huggingface-datasets 스킬을 사용해 데이터셋을 검증하고, split을 확인하며, 행을 미리 보고 페이지네이션하고, 텍스트를 검색하고, 필터를 적용하고, parquet 링크나 통계를 가져올 수 있습니다. 읽기 전용 데이터셋 탐색을 위한 실용적인 huggingface-datasets 가이드입니다.

Web Scraping

즐겨찾기 0GitHub 10.4k

data-scraper-agent

작성자 affaan-m

data-scraper-agent는 웹 스크래핑, 데이터 보강, 저장을 위한 반복 가능한 공개 데이터 파이프라인 구축을 돕습니다. GitHub Actions를 사용해 일정에 맞춰 작업, 가격, 뉴스, 저장소, 스포츠, 목록을 모니터링하도록 설계되었으며, 결과는 Notion, Sheets, 또는 Supabase로 보낼 수 있습니다. 일회성 추출보다는 지속적인 추적에 가장 적합합니다.

Web Scraping

즐겨찾기 0GitHub 156.1k

baoyu-url-to-markdown

작성자 JimLiu

baoyu-url-to-markdown은 Chrome CDP, 사이트별 어댑터, 범용 폴백을 활용해 실시간 URL을 Markdown으로 변환합니다. vendored baoyu-fetch CLI 기반으로 동작하며, Bun 런타임 요구사항, 최초 EXTEND.md 설정, 그리고 X, YouTube, Hacker News, 렌더링 페이지에서의 사용 방식까지 검토할 수 있습니다.

Format Conversion

즐겨찾기 0GitHub 13.2k

x-twitter-scraper

작성자 Xquik-dev

x-twitter-scraper를 사용해 X(Twitter) 데이터와 확인이 필요한 작업을 Xquik으로 조회하세요. 트윗 검색, 사용자 조회, 팔로워 추출, 미디어 다운로드, 모니터링, 웹훅, MCP, 쓰기 작업을 지원합니다. X 로그인 비밀정보가 아닌 API 키를 사용하는 웹 스크래핑형 조사에 가장 적합합니다.

Web Scraping

즐겨찾기 0GitHub 71

exa-search

작성자 K-Dense-AI

exa-search는 Exa로 구동되는 웹 리서치 스킬로, 최신 정보를 찾고 URL에서 콘텐츠를 추출하는 데 사용합니다. 검색, 출처 탐색, 기사 및 PDF 추출, 그리고 의미 기반 검색과 학술 스타일 필터링, 명확한 설치·사용 안내가 필요한 기술·과학 리서치에 적합합니다.

Web Research

즐겨찾기 0GitHub 0

browser-use

작성자 browser-use

browser-use는 페이지 열기, 상태 확인, 인덱스된 요소 클릭, 입력 필드 타이핑, 스크린샷 촬영, 그리고 지속형 브라우저 세션 재사용을 지원하는 브라우저 자동화 스킬입니다. browser-use CLI를 활용해 안정적인 폼 입력, 페이지 이동, 로그인 기반 워크플로에 적합합니다.

Browser Automation

즐겨찾기 0GitHub 84.9k

remote-browser

작성자 browser-use

remote-browser는 샌드박스 환경의 에이전트가 Browser Automation을 위해 헤드리스 브라우저를 제어할 수 있게 해주는 스킬입니다. 페이지 열기, 상태 확인, 인덱스 기반 요소 클릭, 입력 타이핑, 스크린샷 촬영은 물론 로컬 앱이나 CDP 기반 브라우저 세션 연결에도 사용할 수 있습니다.

Browser Automation

즐겨찾기 0GitHub 84.9k

firecrawl

작성자 firecrawl

공식 Firecrawl CLI를 설치하고 인증한 뒤 웹 스크래핑, 검색, 크롤링, 페이지 상호작용에 활용하는 firecrawl 스킬입니다. 설정 방법, `firecrawl --status` 확인, 로그인, `.firecrawl/`로의 안전한 파일 출력, 그리고 repo 근거 기반의 실용적인 사용 패턴까지 익힐 수 있습니다.

Web Scraping

즐겨찾기 0GitHub 234

firecrawl-search

작성자 firecrawl

firecrawl-search는 웹 리서치용 스킬로, 출처를 찾고 구조화된 검색을 수행하며, 필요하면 Firecrawl CLI로 전체 페이지 콘텐츠를 JSON으로 스크래핑할 수 있습니다.

Web Research

즐겨찾기 0GitHub 234

parallel-web

작성자 K-Dense-AI

parallel-web은 parallel-cli로 구동되는 웹 리서치 및 추출 스킬입니다. 웹 검색, URL 콘텐츠 추출, 출처 기반 데이터 보강, 그리고 학술·과학 자료를 우선하는 심층 리서치를 지원합니다. parallel-web 사용법, 웹 리서치, 인용, 증거 우선 워크플로에 활용하기 좋습니다.

Web Research

즐겨찾기 0GitHub 0

geomaster

작성자 K-Dense-AI

geomaster는 GIS, 원격탐사, 공간 분석, 지구 관측 워크플로를 위한 지리공간 과학 스킬입니다. 래스터·벡터 연산, 위성 이미지 처리, 공간 지표 산출, 워크플로 계획 같은 Data Analysis 작업에 활용할 수 있습니다. geomaster 가이드는 이 스킬을 더 적은 시행착오로 설치, 점검, 적용할 수 있도록 도와줍니다.

Data Analysis

즐겨찾기 0GitHub 0

asc-aso-audit

작성자 rudrankriyam

asc-aso-audit는 `./metadata`에 있는 정규 App Store 메타데이터를 대상으로 오프라인 ASO 감사를 실행한 뒤, Astro MCP로 키워드 공백을 찾아내는 데 도움을 줍니다. `asc metadata pull` 이후 asc-aso-audit skill을 사용하면 `subtitle`, `keywords`, `description`, `whatsNew`를 더 적은 추측으로 검토할 수 있습니다.

Data Analysis

즐겨찾기 0GitHub 0

ffuf-web-fuzzing

작성자 jthack

ffuf-web-fuzzing은 숨겨진 웹 콘텐츠를 찾고, 경로와 파라미터를 테스트하며, 원시 요청, 자동 보정, 결과 분석으로 인증된 대상을 퍼징하는 실용적인 스킬입니다. 침투 테스트와 Security Audit 워크플로우에서 반복해서 쓸 수 있는 ffuf-web-fuzzing 가이드가 필요한 보안 테스터에게 잘 맞습니다.

Security Audit

즐겨찾기 0GitHub 0

web-to-markdown

작성자 softaworks

web-to-markdown은 Format Conversion용 skill로, 로컬 `web2md` CLI를 사용해 실제 웹페이지를 깔끔한 Markdown으로 변환합니다. JS 렌더링 페이지, 상호작용이 필요한 흐름, 여러 URL의 일괄 변환까지 Chromium 계열 브라우저를 통해 처리할 수 있으며, 이름으로 명시적으로 호출될 때만 실행됩니다.

Format Conversion

즐겨찾기 0GitHub 1.3k

firecrawl-agent

작성자 firecrawl

firecrawl-agent는 복잡한 다중 페이지 웹사이트에서 구조화된 JSON을 추출할 때 유용합니다. 어떤 상황에서 적합한지, Firecrawl CLI agent를 실행하는 방법, schema 추가, 시작 URL 설정, 그리고 가격 정보·상품 목록·디렉터리형 데이터 추출 결과를 저장하는 방법까지 빠르게 파악할 수 있습니다.

Web Scraping

즐겨찾기 0GitHub 234

firecrawl-map

작성자 firecrawl

firecrawl-map은 사이트의 URL을 찾아 목록화할 때 유용한 스킬로, 더 깊은 scraping이나 crawling에 들어가기 전에 검색 필터링, 개수 제한, JSON 출력, sitemap 모드, 서브도메인 제어 같은 옵션을 활용할 수 있습니다.

Web Scraping

즐겨찾기 0GitHub 234