firecrawl-agent

작성자 firecrawl

firecrawl-agent는 복잡한 다중 페이지 웹사이트에서 구조화된 JSON을 추출할 때 유용합니다. 어떤 상황에서 적합한지, Firecrawl CLI agent를 실행하는 방법, schema 추가, 시작 URL 설정, 그리고 가격 정보·상품 목록·디렉터리형 데이터 추출 결과를 저장하는 방법까지 빠르게 파악할 수 있습니다.

Stars234

즐겨찾기0

추가됨2026년 3월 31일

카테고리Web Scraping

설치 명령어

npx skills add firecrawl/cli --skill firecrawl-agent

큐레이션 점수

이 스킬은 76/100점으로, 디렉터리 등록 후보로는 충분히 탄탄한 편입니다. 에이전트가 활용하기 쉬운 명확한 트리거, 예시 명령어, 자율적인 구조화 웹사이트 추출에 필요한 구체적인 출력 모델을 제공하지만, 기본 범위를 넘어서는 운영 단계에서는 여전히 다소 시행착오가 있을 수 있습니다.

76/100

강점

트리거 명확성이 높습니다. 가격 정보 추출, 상품 목록 수집, 디렉터리 항목 추출, JSON schema 기반 웹사이트 추출처럼 구체적인 사용 사례가 설명에 분명히 제시되어 있습니다.
운영 시작점이 좋습니다. 빠른 시작 예시에서 실제 `firecrawl agent` 명령과 함께 `--wait`, `--schema`, `--urls`, 출력 파일 사용법을 보여 줍니다.
에이전트 활용 가치가 분명합니다. 단순 스크래핑보다 더 복잡한 다중 페이지 구조화 추출에 적합하다는 점을 명확히 설명합니다.

주의점

설치 및 설정 안내는 제한적입니다. SKILL.md에는 설치 명령이 없고, 선행 조건을 확인할 수 있는 지원 파일이나 참고 링크도 연결되어 있지 않습니다.
더 깊은 워크플로 안내 근거는 부족합니다. 저장소 미리보기에는 SKILL.md 파일 하나만 보이며, 제약 조건 설명도 제한적이고 스크립트, 규칙, 문제 해결 자료도 확인되지 않습니다.

Scraping JSON-LD Website Websites Cli Automation Ai

개요

firecrawl-agent 스킬 개요

firecrawl-agent가 하는 일

firecrawl-agent 스킬은 일반적인 단일 페이지 스크래핑만으로는 부족할 때 쓰는 자율형 웹 데이터 추출 도구입니다. 사이트를 탐색하면서 관련 정보가 어디에 있는지 스스로 판단하고, 구조화된 JSON으로 결과를 반환하도록 설계되어 있습니다. 특히 가격표, 제품 카탈로그, 디렉터리 항목, 기능 목록처럼 여러 페이지에 걸쳐 있는 데이터를 수집하는 작업에 잘 맞습니다.

잘 맞는 사용자

이 firecrawl-agent skill은 원시 HTML이 아니라 바로 활용 가능한 데이터를 원하는 사용자에게 가장 적합합니다. 예를 들어 데이터셋을 만드는 운영 담당자, 경쟁사·시장 정보를 수집하는 분석가, 후속 자동화 파이프라인에 데이터를 넣는 개발자, 그리고 즉흥적인 복붙 대신 스키마 기반의 다중 페이지 추출을 원하는 AI 사용자에게 특히 유용합니다.

실제로 해결하는 핵심 작업

대부분의 사용자는 추상적인 의미의 “web scraping” 자체를 원하는 것이 아닙니다. 실제로는 다음과 같은 구체적인 질문에 답하고 싶어 합니다.

SaaS 사이트에서 모든 요금제를 추출하기
여러 페이지에 걸친 제품명과 가격 수집하기
디렉터리를 JSON 레코드로 변환하기
URL을 일일이 손으로 매핑하지 않고 구조화된 사실만 모으기

이 지점에서 firecrawl-agent for Web Scraping은 범용 프롬프트와 분명히 다릅니다.

일반 프롬프트 대신 firecrawl-agent를 선택하는 이유

일반적인 모델 프롬프트는 셀렉터를 제안하거나 눈에 보이는 콘텐츠를 요약하는 데는 도움이 될 수 있지만, 여러 페이지를 넘나드는 견고한 자율 추출 워크플로를 제공하는 경우는 드뭅니다. firecrawl-agent는 바로 그 사용 사례를 위해 만들어졌습니다. 추출 목표를 주고, 필요하면 스키마를 함께 주면, 에이전트가 사이트를 탐색해 기계가 바로 사용할 수 있는 형태의 결과를 반환합니다.

설치 전에 알아둘 핵심 트레이드오프

장점은 페이지별 수작업을 크게 줄일 수 있다는 점입니다. 대신 실행 시간이 듭니다. 에이전트는 몇 분 정도 걸릴 수 있고, 결과 품질은 대상 필드와 범위를 얼마나 명확하게 정의했는지에 크게 좌우됩니다. 필요가 “한 페이지를 빨리 긁어오기” 수준이라면 이 도구는 과할 수 있습니다.

firecrawl-agent 스킬 사용 방법

firecrawl-agent 설치 맥락

상위 스킬은 Bash를 통해 firecrawl을 사용할 수 있게 하며, 여기에는 firecrawl agent와 npx firecrawl이 포함됩니다. 이를 skills 기반 환경에 설치하려면 다음을 사용하세요.

npx skills add https://github.com/firecrawl/cli --skill firecrawl-agent

실무에서는 이것만으로 끝나지 않습니다. 실행 환경에 Firecrawl CLI가 실제로 사용 가능해야 하고, 해당 CLI가 요구하는 인증이나 초기 설정도 함께 갖춰져 있어야 합니다.

가장 먼저 읽어야 할 파일

먼저 skills/firecrawl-agent/SKILL.md를 확인하세요. 이 저장소에서는 그 파일에 실질적인 사용 가이드가 거의 모두 들어 있습니다. 이 스킬에는 눈에 띄는 rules/, resources/, 보조 스크립트가 따로 보이지 않으므로, 설치할지 말지는 결국 예제와 CLI 옵션이 내 워크플로에 맞는지를 기준으로 판단하는 편이 좋습니다.

핵심 실행 패턴 이해하기

기본적인 firecrawl-agent usage 패턴은 단순합니다.

추출 목표를 설명한다
필요하면 스키마를 제공한다
필요하면 시작 URL로 범위를 제한한다
작업이 끝날 때까지 기다린다
JSON 결과를 파일로 저장한다

스킬에 포함된 대표 예시는 다음과 같습니다.

firecrawl agent "extract all pricing tiers" --wait -o .firecrawl/pricing.json

firecrawl agent "extract products" --schema '{"type":"object","properties":{"name":{"type":"string"},"price":{"type":"number"}}}' --wait -o .firecrawl/products.json

firecrawl agent "get feature list" --urls "<url>" --wait -o .firecrawl/features.json

firecrawl-agent 스킬에 필요한 입력

firecrawl-agent skill은 아래 세 가지를 분명하게 줄 때 가장 잘 동작합니다.

추출 목표
대상 사이트 또는 시작 URL
원하는 출력 형태

약한 입력:

“scrape this site”

더 나은 입력:

“Extract all pricing tiers from https://example.com/pricing and related plan pages. Return plan name, monthly price, annual price, included seats, and top features as JSON.”

가장 좋은 입력:

“Starting from https://example.com/pricing, extract every current pricing tier visible on the site. Return JSON with plans[] containing name, billing_period, price, currency, seat_limit, features[], and source_url. Ignore blog pages, docs, and historical changelog content.”

언제 스키마를 써야 하나

출력 결과를 코드, 스프레드시트, 검증 로직, 반복 실행 워크플로에 넣어야 한다면 --schema를 쓰는 편이 좋습니다. 특히 다음 상황에서 스키마의 효과가 큽니다.

필드명이 안정적으로 유지되어야 할 때
숫자나 배열처럼 타입이 있는 값이 필요할 때
애매한 요약 결과를 줄이고 싶을 때
실행마다 혹은 사이트 간 결과를 비교할 계획일 때

스키마가 없어도 에이전트가 잘 동작할 수는 있지만, 후속 자동화 관점에서는 결과 일관성이 떨어질 수 있습니다.

거친 목표를 좋은 프롬프트로 바꾸는 법

좋은 firecrawl-agent guide 프롬프트에는 보통 다음 요소가 들어갑니다.

대상 엔터티 유형: 요금제, 제품, 목록, 위치
수집 범위 규칙: 예시가 아니라 현재 존재하는 모든 항목
제외 조건: docs, blog, careers, changelog 제외
정규화 규칙: 가격은 숫자로, 항목당 레코드 하나
출처 정보: source_url 포함
예외 처리 정책: 필드가 없으면 null 반환

예시:

firecrawl agent "Extract all products from the site. Return JSON with products[] containing name, price, currency, short_description, category, availability, and source_url. Only include live product pages. Ignore blog, support, and policy pages. If price is missing, use null." --urls "https://example.com" --wait -o .firecrawl/products.json

시작 URL로 드리프트 줄이기

URL을 주지 않으면 에이전트가 어디를 탐색할지 더 넓게 스스로 판단할 수 있습니다. 어떤 경우에는 이게 장점이지만, 불필요한 탐색이 늘어날 가능성도 커집니다. 정확도를 높이려면 다음처럼 가능성이 높은 진입점을 시작 URL로 주는 편이 좋습니다.

가격 페이지
제품 카테고리 페이지
회사 디렉터리
마켓플레이스 목록 페이지

실무에서 firecrawl-agent install 성공률을 높이는 가장 효과적인 개선점 중 하나가 바로 이 부분입니다.

신뢰도 높은 추출을 위한 권장 워크플로

실용적인 워크플로는 다음과 같습니다.

가능성이 높은 단일 소스 페이지에서 좁게 테스트한다
JSON을 확인해 누락되거나 합쳐진 필드를 점검한다
스키마와 제외 규칙을 추가한다
시작 URL 범위를 더 넓힌다
.firecrawl/ 같은 전용 폴더에 결과를 저장한다
개수를 검증하고 원본 페이지를 샘플 확인한다

처음부터 범위를 넓게 잡고 노이즈가 많은 결과를 디버깅하는 것보다 이 방식이 훨씬 빠릅니다.

출력 처리와 파일 전략

결과는 -o로 예측 가능한 경로에 저장하세요. 자율 추출 작업은 결과를 버전 관리하거나 시간에 따라 비교할 수 있을 때 평가가 훨씬 쉬워집니다. 좋은 예시는 다음과 같습니다.

.firecrawl/pricing.json
.firecrawl/products.json
.firecrawl/directory.json

반복 실행 중이라면 무조건 output.json을 덮어쓰기보다는, 각 실행 목적이 파일명에 드러나도록 관리하는 편이 좋습니다.

실무 적합성: firecrawl-agent for Web Scraping이 특히 강한 경우

firecrawl-agent for Web Scraping은 다음 조건에서 특히 강합니다.

대상 데이터가 여러 페이지에 걸쳐 있을 때
사이트 구조를 사전에 완전히 알지 못할 때
자연어 설명이 아니라 구조화된 JSON이 필요할 때
손수 스크래핑 규칙을 작성하는 비용이 작업 가치보다 더 클 때

실무 부적합성: 이런 경우에는 쓰지 않는 편이 낫다

다음 상황이라면 firecrawl-agent는 건너뛰는 편이 낫습니다.

한 페이지 요약만 필요할 때
규정 준수 중심 워크플로 때문에 정확히 결정적인 셀렉터가 필요할 때
이미 잘 알려진 페이지 구조에 대해 안정적인 스크래퍼를 갖고 있을 때
사이트가 매우 상호작용적이거나, 접근이 제한되어 있거나, 현재 환경에서 지원되지 않는 세션별 플로우에 강하게 의존할 때

firecrawl-agent 스킬 FAQ

firecrawl-agent는 초보자에게도 괜찮은가요?

그렇습니다. CLI를 어느 정도 다룰 줄 알고, 출력 필드 중심으로 생각할 수 있다면 충분히 시작할 수 있습니다. 기본 예제 자체는 어렵지 않습니다. 초보자가 가장 많이 막히는 지점은 설치 문법이 아니라, 모호하게 요청하는 대신 완전한 추출 대상을 어떻게 지정하느냐입니다.

firecrawl-agent는 일반적인 AI 프롬프팅과 무엇이 다른가요?

일반 프롬프트는 분석이나 일회성 페이지 내용 처리에서 끝나는 경우가 많습니다. 반면 firecrawl-agent usage는 자율적인 사이트 탐색과 구조화된 추출을 중심으로 설계되어 있습니다. 바로 이 조합 때문에, 단순히 “이 웹사이트를 요약해줘”라고 요청하는 대신 이 스킬을 사용할 이유가 생깁니다.

항상 JSON 스키마가 필요한가요?

아닙니다. 탐색적 작업이라면 단순한 추출 요청만으로도 충분할 수 있습니다. 하지만 실행 간 일관성, 자동화, 깔끔한 타입 필드가 필요하다면 보통 스키마를 추가하는 1분의 수고가 충분히 값어치를 합니다.

firecrawl-agent는 얼마나 걸리나요?

스킬 설명에 따르면 자율 추출은 대략 2~5분 정도 걸릴 수 있습니다. 단순한 단일 페이지 스크래핑보다 오래 걸린다고 보는 편이 맞고, 관련 페이지 수가 많은 사이트일수록 더 길어질 수 있습니다.

firecrawl-agent로 가격표, 제품, 디렉터리를 추출할 수 있나요?

네. 바로 그런 작업이 이 스킬의 대표 사용 사례입니다. 요금제, 제품 목록, 디렉터리형 항목처럼 사이트 전반에 흩어져 있는 구조화된 레코드를 수집하는 데 초점이 맞춰져 있습니다.

모든 스크래핑 작업에 firecrawl-agent가 정답인가요?

아닙니다. 작업이 너무 단순하거나, 완전히 결정적이거나, 이미 기존 스크래퍼로 충분히 해결된다면 이 스킬은 불필요할 수 있습니다. 이 스킬의 가치는 탐색과 네비게이션 자체가 문제의 일부일 때 가장 크게 드러납니다.

firecrawl-agent 스킬 개선 방법

firecrawl-agent에 더 명확한 추출 계약을 주기

대개 가장 큰 품질 향상은 “extract data” 수준의 요청을 아래 요소를 갖춘 명시적인 계약으로 바꿀 때 나옵니다.

정확한 필드
포함 규칙
제외 규칙
null 처리 방식
source URL 수집

이렇게 해야 근거 없는 구조 생성이 줄고, 결과를 더 신뢰하기 쉬워집니다.

범위를 넓히기 전에 먼저 좁혀라

좋지 않은 결과의 상당수는 도메인 루트에서 느슨한 목표로 시작할 때 발생합니다. 먼저 신호가 강한 URL 한두 개로 시작해 필드 품질을 확인하고, 그 다음 스키마와 프롬프트가 제대로 작동하는 것이 확인된 후에만 범위를 넓히세요.

모든 레코드에 출처를 요구하라

결과를 검토하거나 디버깅해야 한다면 항목마다 source_url을 포함시키세요. 이 필드 하나만 있어도 firecrawl-agent guide 워크플로가 훨씬 수월해집니다. 추출된 레코드가 정말 의도한 페이지에서 왔는지 빠르게 검증할 수 있기 때문입니다.

자주 흔들리는 필드는 정규화 규칙을 명시하라

현실의 웹 데이터는 지저분하게 흔들리기 쉽습니다. 에이전트에게 다음을 어떻게 처리할지 미리 알려주세요.

가격을 숫자로 볼지 문자열로 볼지
월별 과금과 연별 과금을 어떻게 구분할지
기능 목록은 배열로 받을지
누락 필드는 null로 둘지
제품이나 요금제당 레코드 하나로 제한할지

이런 지시는 기계가 읽기 좋은 결과를 만드는 데 실질적으로 도움이 됩니다.

자주 발생하는 실패 패턴을 주의하라

대표적인 문제는 다음과 같습니다.

서로 다른 페이지 유형이 한 데이터셋에 섞임
변형 페이지 때문에 중복 레코드가 생김
기능 요약이 하나의 큰 덩어리로 뭉쳐짐
가격이 숫자가 아니라 텍스트 조각으로 잡힘
시작점이 너무 넓거나 약해서 사이트 커버리지가 부분적으로만 확보됨

이 문제들의 대부분은 같은 모호한 명령을 다시 실행해서 해결되지 않습니다. 범위 설정과 스키마 설계를 강화해야 합니다.

누락량보다 출력 결함을 기준으로 반복 개선하라

첫 실행 결과가 틀렸다면, 단순히 “더 많은 페이지를 봐”라고만 하지 마세요. 먼저 어떤 결함인지 특정해야 합니다.

필드가 잘못됨
페이지 유형이 잘못됨
중복이 있음
정규화가 빠짐
커버리지가 불완전함

그다음 그 결함을 겨냥해 프롬프트를 직접 수정하세요. firecrawl-agent 결과를 빠르게 개선하는 가장 좋은 방법입니다.

강력한 2차 수정 패턴

두 번째 패스에서 유용한 프롬프트 패턴은 다음과 같습니다.

같은 목표는 유지한다
제외 규칙을 추가한다
필드 정의를 더 엄격하게 한다
출처 정보를 요구한다
누락값 처리 방식을 명시한다

수정 예시:

첫 실행: “extract all pricing tiers”
두 번째 실행: “Extract all current pricing tiers from pricing and plan pages only. Ignore docs, blog, changelog, and legacy pages. Return plans[] with name, price, currency, billing_period, features[], and source_url. Use null when a field is not present.”

설치 판단을 더 잘하려면 먼저 이것부터 확인하라

firecrawl-agent skill을 도입하기 전에, 실제 병목이 탐색 경로 발견인지 아니면 추출 결과 포맷팅인지 먼저 자문해 보세요. 병목이 여러 페이지에 걸친 탐색 경로 발견이라면 이 스킬은 매우 잘 맞습니다. 반대로 그렇지 않다면, 더 단순한 스크래핑 도구나 단일 페이지 추출 도구가 더 빠르고 유지보수도 쉬울 수 있습니다.

평점 및 리뷰

아직 평점이 없습니다

리뷰 남기기

이 스킬의 평점과 리뷰를 남기려면 로그인하세요.

0/10000

최신 리뷰

저장 중...

이 카테고리의 다른 스킬

huggingface-datasets

작성자 huggingface

Hugging Face Dataset Viewer API 작업에 이 huggingface-datasets 스킬을 사용해 데이터셋을 검증하고, split을 확인하며, 행을 미리 보고 페이지네이션하고, 텍스트를 검색하고, 필터를 적용하고, parquet 링크나 통계를 가져올 수 있습니다. 읽기 전용 데이터셋 탐색을 위한 실용적인 huggingface-datasets 가이드입니다.

Web Scraping

즐겨찾기 0GitHub 10.4k

data-scraper-agent

작성자 affaan-m

data-scraper-agent는 웹 스크래핑, 데이터 보강, 저장을 위한 반복 가능한 공개 데이터 파이프라인 구축을 돕습니다. GitHub Actions를 사용해 일정에 맞춰 작업, 가격, 뉴스, 저장소, 스포츠, 목록을 모니터링하도록 설계되었으며, 결과는 Notion, Sheets, 또는 Supabase로 보낼 수 있습니다. 일회성 추출보다는 지속적인 추적에 가장 적합합니다.

Web Scraping

즐겨찾기 0GitHub 156.1k

baoyu-url-to-markdown

작성자 JimLiu

baoyu-url-to-markdown은 Chrome CDP, 사이트별 어댑터, 범용 폴백을 활용해 실시간 URL을 Markdown으로 변환합니다. vendored baoyu-fetch CLI 기반으로 동작하며, Bun 런타임 요구사항, 최초 EXTEND.md 설정, 그리고 X, YouTube, Hacker News, 렌더링 페이지에서의 사용 방식까지 검토할 수 있습니다.

Format Conversion

즐겨찾기 0GitHub 13.2k

x-twitter-scraper

작성자 Xquik-dev

x-twitter-scraper를 사용해 X(Twitter) 데이터와 확인이 필요한 작업을 Xquik으로 조회하세요. 트윗 검색, 사용자 조회, 팔로워 추출, 미디어 다운로드, 모니터링, 웹훅, MCP, 쓰기 작업을 지원합니다. X 로그인 비밀정보가 아닌 API 키를 사용하는 웹 스크래핑형 조사에 가장 적합합니다.

Web Scraping

즐겨찾기 0GitHub 71

exa-search

작성자 K-Dense-AI

exa-search는 Exa로 구동되는 웹 리서치 스킬로, 최신 정보를 찾고 URL에서 콘텐츠를 추출하는 데 사용합니다. 검색, 출처 탐색, 기사 및 PDF 추출, 그리고 의미 기반 검색과 학술 스타일 필터링, 명확한 설치·사용 안내가 필요한 기술·과학 리서치에 적합합니다.

Web Research

즐겨찾기 0GitHub 0

browser-use

작성자 browser-use

browser-use는 페이지 열기, 상태 확인, 인덱스된 요소 클릭, 입력 필드 타이핑, 스크린샷 촬영, 그리고 지속형 브라우저 세션 재사용을 지원하는 브라우저 자동화 스킬입니다. browser-use CLI를 활용해 안정적인 폼 입력, 페이지 이동, 로그인 기반 워크플로에 적합합니다.

Browser Automation

즐겨찾기 0GitHub 84.9k

remote-browser

작성자 browser-use

remote-browser는 샌드박스 환경의 에이전트가 Browser Automation을 위해 헤드리스 브라우저를 제어할 수 있게 해주는 스킬입니다. 페이지 열기, 상태 확인, 인덱스 기반 요소 클릭, 입력 타이핑, 스크린샷 촬영은 물론 로컬 앱이나 CDP 기반 브라우저 세션 연결에도 사용할 수 있습니다.

Browser Automation

즐겨찾기 0GitHub 84.9k

firecrawl

작성자 firecrawl

공식 Firecrawl CLI를 설치하고 인증한 뒤 웹 스크래핑, 검색, 크롤링, 페이지 상호작용에 활용하는 firecrawl 스킬입니다. 설정 방법, `firecrawl --status` 확인, 로그인, `.firecrawl/`로의 안전한 파일 출력, 그리고 repo 근거 기반의 실용적인 사용 패턴까지 익힐 수 있습니다.

Web Scraping

즐겨찾기 0GitHub 234

firecrawl-search

작성자 firecrawl

firecrawl-search는 웹 리서치용 스킬로, 출처를 찾고 구조화된 검색을 수행하며, 필요하면 Firecrawl CLI로 전체 페이지 콘텐츠를 JSON으로 스크래핑할 수 있습니다.

Web Research

즐겨찾기 0GitHub 234

parallel-web

작성자 K-Dense-AI

parallel-web은 parallel-cli로 구동되는 웹 리서치 및 추출 스킬입니다. 웹 검색, URL 콘텐츠 추출, 출처 기반 데이터 보강, 그리고 학술·과학 자료를 우선하는 심층 리서치를 지원합니다. parallel-web 사용법, 웹 리서치, 인용, 증거 우선 워크플로에 활용하기 좋습니다.

Web Research

즐겨찾기 0GitHub 0

geomaster

작성자 K-Dense-AI

geomaster는 GIS, 원격탐사, 공간 분석, 지구 관측 워크플로를 위한 지리공간 과학 스킬입니다. 래스터·벡터 연산, 위성 이미지 처리, 공간 지표 산출, 워크플로 계획 같은 Data Analysis 작업에 활용할 수 있습니다. geomaster 가이드는 이 스킬을 더 적은 시행착오로 설치, 점검, 적용할 수 있도록 도와줍니다.

Data Analysis

즐겨찾기 0GitHub 0

asc-aso-audit

작성자 rudrankriyam

asc-aso-audit는 `./metadata`에 있는 정규 App Store 메타데이터를 대상으로 오프라인 ASO 감사를 실행한 뒤, Astro MCP로 키워드 공백을 찾아내는 데 도움을 줍니다. `asc metadata pull` 이후 asc-aso-audit skill을 사용하면 `subtitle`, `keywords`, `description`, `whatsNew`를 더 적은 추측으로 검토할 수 있습니다.

Data Analysis

즐겨찾기 0GitHub 0

ffuf-web-fuzzing

작성자 jthack

ffuf-web-fuzzing은 숨겨진 웹 콘텐츠를 찾고, 경로와 파라미터를 테스트하며, 원시 요청, 자동 보정, 결과 분석으로 인증된 대상을 퍼징하는 실용적인 스킬입니다. 침투 테스트와 Security Audit 워크플로우에서 반복해서 쓸 수 있는 ffuf-web-fuzzing 가이드가 필요한 보안 테스터에게 잘 맞습니다.

Security Audit

즐겨찾기 0GitHub 0

web-to-markdown

작성자 softaworks

web-to-markdown은 Format Conversion용 skill로, 로컬 `web2md` CLI를 사용해 실제 웹페이지를 깔끔한 Markdown으로 변환합니다. JS 렌더링 페이지, 상호작용이 필요한 흐름, 여러 URL의 일괄 변환까지 Chromium 계열 브라우저를 통해 처리할 수 있으며, 이름으로 명시적으로 호출될 때만 실행됩니다.

Format Conversion

즐겨찾기 0GitHub 1.3k

firecrawl-map

작성자 firecrawl

firecrawl-map은 사이트의 URL을 찾아 목록화할 때 유용한 스킬로, 더 깊은 scraping이나 crawling에 들어가기 전에 검색 필터링, 개수 제한, JSON 출력, sitemap 모드, 서브도메인 제어 같은 옵션을 활용할 수 있습니다.

Web Scraping

즐겨찾기 0GitHub 234

firecrawl-crawl

작성자 firecrawl

firecrawl-crawl은 path 필터, depth 제한, 페이지 수 상한, wait 모드, 작업 상태 확인을 통해 웹사이트나 docs 섹션의 콘텐츠를 대량으로 추출할 수 있게 도와주는 스킬입니다.

Web Scraping

즐겨찾기 0GitHub 234