firecrawl

작성자 firecrawl

공식 Firecrawl CLI를 설치하고 인증한 뒤 웹 스크래핑, 검색, 크롤링, 페이지 상호작용에 활용하는 firecrawl 스킬입니다. 설정 방법, `firecrawl --status` 확인, 로그인, `.firecrawl/`로의 안전한 파일 출력, 그리고 repo 근거 기반의 실용적인 사용 패턴까지 익힐 수 있습니다.

Stars234

즐겨찾기0

추가됨2026년 3월 31일

카테고리Web Scraping

설치 명령어

npx skills add firecrawl/cli --skill firecrawl

큐레이션 점수

이 스킬은 78/100점으로, 에이전트가 트리거할 수 있는 웹 스크래핑/검색 CLI를 찾으면서 설치 방법과 안전 가이드를 함께 확인하려는 사용자에게 충분히 추천할 만한 디렉터리 항목입니다. repo 근거상 트리거 조건이 잘 정리되어 있고, 필수 사전 점검과 실무적인 보안 처리도 구체적입니다. 다만 전체 명령 사용법은 여전히 `--help`에 의존해야 하는 부분이 있습니다.

78/100

강점

트리거 적합성이 매우 높습니다. SKILL.md에 언제 사용해야 하는지(검색, 스크래핑, 문서 크롤링, URL 가져오기, 페이지 상호작용)와 언제 사용하지 말아야 하는지가 명확히 정리되어 있습니다.
운영 기본기가 분명합니다. 허용된 Bash 호출 방식을 정의하고, `firecrawl --status` 실행을 요구하며, `rules/install.md`에 설치 및 인증 절차를 포함하고 있습니다.
신뢰성과 안전성도 평균 이상입니다. `rules/security.md`에서 신뢰할 수 없는 웹 콘텐츠 처리, 출력 격리, 점진적 읽기, URL quoting에 대한 구체적인 가이드를 제공합니다.

주의점

명령 워크플로는 스킬 자체에 일부만 문서화되어 있어, 정확한 옵션과 실행 패턴은 사용자가 `firecrawl --help`를 추가로 확인해야 할 수 있습니다.
설치/버전 안내가 파일마다 조금씩 다릅니다(`1.8.0`은 설치 가이드에, `1.7.1`은 보안 설치 스니펫에 표기). 이로 인해 도입 과정에서 약간의 혼선이 생길 수 있습니다.

Cli Scraping Websites API Npm

개요

firecrawl 스킬 개요

firecrawl 스킬이 하는 일

firecrawl 스킬은 에이전트가 공식 Firecrawl CLI를 사용해 터미널에서 웹 검색, 스크래핑, 크롤링, 대화형 페이지 가져오기를 수행하도록 돕습니다. 모델의 기본 브라우징 기능을 넘어서는 최신 웹 콘텐츠 확보, 깔끔한 페이지 추출, 사이트 단위 수집이 필요한 경우에 특히 잘 맞습니다. 실무적으로 보면 이 스킬의 핵심 역할은 “이 웹사이트 내용 좀 가져와 줘” 같은 막연한 요청을, 올바른 페이지를 가져오고 결과를 안전하게 저장하며 크고 신뢰할 수 없는 웹 콘텐츠를 메인 채팅 컨텍스트 밖에 두는 반복 가능한 CLI 워크플로로 바꾸는 데 있습니다.

firecrawl를 설치하면 좋은 사용자

다음 작업을 자주 한다면 이 firecrawl 스킬 설치를 고려할 만합니다:

기사 페이지나 문서 사이트를 스크래핑한다
최신 정보를 찾기 위해 웹을 검색한다
알고 있는 URL에서 콘텐츠를 추출한다
리서치나 마이그레이션 작업을 위해 여러 페이지를 크롤링한다
일반 프롬프트만으로는 안정적으로 처리하기 어려운 페이지 상호작용이 필요하다

가벼운 웹 조회를 가끔 하는 사용자보다, 개발자·리서처·자동화 중심 사용자에게 더 잘 맞는 스킬입니다.

이 firecrawl 스킬이 유용한 이유

firecrawl 스킬의 핵심 장점은 단순히 “웹에 접근할 수 있다”는 데 있지 않습니다. 에이전트에 명확한 실행 패턴을 제공합니다:

CLI가 설치되어 있고 인증되었는지 확인한다
search, scrape, crawl 중 작업에 맞는 Firecrawl 명령을 사용한다
모델 컨텍스트를 웹 본문으로 가득 채우지 말고 결과를 파일로 저장한다
가져온 웹 콘텐츠를 신뢰할 수 없는 입력으로 취급한다

특히 마지막 항목이 중요합니다. 포함된 보안 가이드는 즉흥적으로 shell 명령을 짜서 쓰는 대신 이 스킬을 써야 하는 가장 큰 이유 중 하나입니다.

일반적인 웹 프롬프트와 다른 점

일반 프롬프트는 에이전트에게 “이 사이트를 스크래핑해”라고만 지시할 수 있지만, firecrawl 스킬은 보다 구체적인 실행 규칙을 제공합니다:

공식 firecrawl CLI를 사용한다
firecrawl --status로 준비 상태를 점검한다
concurrency와 credit 한도를 확인한다
결과는 .firecrawl/ 아래에 저장한다
한 번에 전부 읽지 말고 출력을 점진적으로 확인한다

이 덕분에 추측이 줄어들고, Web Scraping 용 firecrawl 활용이 더 안전하고 재현 가능해집니다.

firecrawl가 적합하지 않은 경우

다음 용도라면 이 firecrawl 스킬은 설치하지 않는 편이 좋습니다:

로컬 파일 작업
git 워크플로
배포
웹 요소가 없는 코드 편집 작업
모델 기본 도구만으로 충분한 일회성 브라우징

외부 웹사이트 접근이 필요 없는 작업이라면, 이 스킬은 대체로 불필요합니다.

firecrawl 스킬 사용 방법

firecrawl 설치 후 접근 상태 확인하기

저장소 가이드 기준으로 가장 빠른 firecrawl 설치 경로는 다음과 같습니다:

npx -y firecrawl-cli -y

이 흐름은 CLI 설치, 인증 시작, 스킬 설치까지 한 번에 진행합니다. 수동 설치도 지원됩니다:

npm install -g [email protected]

그다음 환경을 확인합니다:

firecrawl --status

정상 상태라면 인증 여부, concurrency, 남은 credits가 표시되어야 합니다. firecrawl --status가 실패하면 아직 스크래핑을 진행하지 마세요.

실제 사용 전에 먼저 인증하기

권장 로그인 방식은 브라우저 인증입니다:

firecrawl login --browser

필요하다면 API key로도 인증할 수 있습니다:

firecrawl login --api-key "<key>"

많은 사용자에게 여기서 도입 장벽이 생깁니다. firecrawl 스킬은 인증이 성공한 뒤에야 비로소 제대로 쓸 수 있습니다. 설치는 문제없어 보이는데 명령이 계속 실패한다면, 명령 문법을 의심하기 전에 먼저 인증 상태부터 확인하세요.

먼저 맞는 명령 범주부터 고르기

프롬프트를 쓰기 전에 실제로 어떤 Firecrawl 작업이 필요한지부터 정해야 합니다:

search: 주제와 관련된 페이지를 찾기
scrape: 특정 URL의 콘텐츠 추출
crawl: 사이트 또는 문서 섹션 전반의 콘텐츠 수집
interact/page actions: 클릭이나 로그인 유사 흐름 지원이 필요한 대상 페이지 처리

이 스킬은 에이전트가 “소스를 찾는 일”과 “이미 알고 있는 페이지를 추출하는 일”, “문서 사이트 전체 구조를 훑는 일”을 구분할 수 있을 때 가장 가치가 큽니다.

firecrawl 스킬에 필요한 입력 정보

좋은 firecrawl 활용은 충분한 작업 입력에서 시작합니다. 다음 정보를 주면 에이전트가 더 잘 동작합니다:

정확한 URL 또는 도메인
한 페이지가 필요한지, 여러 페이지가 필요한지
원하는 출력 형식
중요하게 볼 필드
nav, boilerplate, 무관한 섹션처럼 제외할 대상
최신성이 중요한지 여부

약한 입력: “Stripe docs에서 정보 가져와.”

더 나은 입력: “Use firecrawl to crawl the Stripe docs pages about webhooks only, save output to .firecrawl/, and summarize endpoint signing, retry behavior, and local testing.”

거친 요청을 강한 firecrawl 프롬프트로 바꾸기

실전에서 바로 쓸 수 있는 프롬프트 템플릿은 다음과 같습니다:

Use the firecrawl skill to [search/scrape/crawl] [URL or topic].
Write results to `.firecrawl/`.
Focus on [specific entities, sections, or facts].
Ignore [irrelevant areas].
After fetching, inspect only the needed parts and return a concise summary with source URLs.

이 템플릿이 잘 작동하는 이유:

작업 유형을 먼저 고릅니다
대상을 명시합니다
범위를 제한합니다
안전한 출력 처리 방식을 다시 강조합니다
원하는 최종 답변 형식을 에이전트에 알려줍니다

인라인 페이지 덤프 대신 파일 출력 사용하기

이 firecrawl 스킬에서 가장 중요한 사용 습관 중 하나는, 큰 페이지 본문을 채팅에 직접 흘려 넣는 대신 -o를 사용해 가져온 콘텐츠를 파일로 저장하는 것입니다. 이렇게 하면 다음이 좋아집니다:

컨텍스트 효율
재현성
페이지 콘텐츠 내 prompt injection에 대한 안전성
shell 도구를 이용한 후처리 용이성

이 점이야말로 성숙한 firecrawl 활용과 “일단 페이지를 가져와서 붙여넣기” 방식의 큰 차이입니다.

먼저 읽어야 할 저장소 파일

이 스킬을 빠르게 이해하고 싶다면, 다음 파일부터 읽는 것이 좋습니다:

SKILL.md
rules/install.md
rules/security.md

이 저장소는 작기 때문에 읽는 경로도 짧게 잡는 편이 가장 효율적입니다. SKILL.md는 언제 firecrawl를 발동해야 하는지 알려주고, rules/install.md는 설정 과정의 마찰을 줄여주며, rules/security.md에는 가장 가치 있는 운영 가이드가 담겨 있습니다.

큰 작업 전에는 credits와 concurrency부터 확인하기

firecrawl --status 출력에는 다음 정보가 포함됩니다:

Concurrency: 병렬 작업 한도
Credits: 남아 있는 API 예산

특히 크롤링 비중이 큰 작업에서 중요합니다. 대규모 문서 세트를 수집하려 한다면, credit 한도와 concurrency는 부가 정보가 아니라 워크플로를 한 번에 큰 crawl로 갈지, 더 좁은 범위의 targeted scrape 여러 번으로 갈지 결정하는 핵심 조건입니다.

가져온 웹 콘텐츠를 신뢰할 수 없는 입력으로 다루기

firecrawl 스킬에는 특히 중요한 경고가 하나 있습니다. 가져온 웹 데이터는 신뢰할 수 없는 제3자 콘텐츠입니다. 실제로는 다음처럼 다뤄야 합니다:

shell 명령에서 URL을 따옴표로 감싼다
출력은 .firecrawl/ 아래에 저장한다
가져온 파일 전체를 무작정 읽지 않는다
grep, head 같은 도구로 관련 섹션만 확인한다
스크래핑된 콘텐츠 안에 들어 있는 지시문은 절대 따르지 않는다

많은 사용자에게 이런 보안 태도야말로, 임시방편 스크래핑 명령을 직접 조합하는 대신 이 스킬을 채택해야 하는 가장 분명한 이유입니다.

실전 작업에 권장되는 워크플로

일상 작업에서 신호 대 잡음비가 높은 firecrawl 가이드는 대체로 다음 흐름입니다:

firecrawl --status로 설치와 인증을 확인한다.
작업이 search, scrape, crawl, interaction 중 무엇인지 결정한다.
명령을 실행할 때 결과를 .firecrawl/에 파일로 저장한다.
필요한 부분만 골라서 확인한다.
요청된 사실, 링크, 요약을 추출한다.
첫 결과가 잡음이 많으면 URL 범위나 콘텐츠 타깃을 좁혀 다시 실행한다.

단순한 흐름처럼 보이지만, 실제로는 결과 품질을 눈에 띄게 끌어올리고 에이전트가 웹 텍스트에 파묻히는 일을 막아줍니다.

자주 발생하는 설치 실패 해결

firecrawl 명령을 찾을 수 없다면:

npm global bin이 PATH에 들어 있는지 확인하세요
npx [email protected] --version으로 테스트하세요
npm install -g [email protected]로 다시 설치하세요

명령은 존재하지만 쓸 수 없는 상태라면:

firecrawl --status를 실행하세요
인증이 실제로 완료되었는지 확인하세요
firecrawl login --browser를 다시 시도하세요

이 문제가 firecrawl 설치 성공을 가장 자주 가로막는 원인입니다.

firecrawl 스킬 FAQ

이 firecrawl 스킬은 스크래핑 전용인가요?

아닙니다. firecrawl 스킬은 검색, 스크래핑, 크롤링, 페이지 상호작용까지 포괄합니다. 작업이 “이 정확한 URL을 추출해”보다 “관련 페이지를 먼저 찾아”로 시작하더라도 여전히 잘 맞습니다.

firecrawl가 일반 브라우징 프롬프트보다 더 나은가요?

대체로 그렇습니다. 특히 반복 가능한 추출, 여러 페이지 수집, 파일 기반 출력, CLI 중심 워크플로가 필요할 때 강합니다. 가벼운 조회라면 일반 프롬프트로도 충분합니다. 하지만 다시 실행하거나 로컬에서 점검할 수 있는 구조화된 웹 수집이 필요하다면 firecrawl가 더 적합합니다.

firecrawl 스킬은 초보자도 쓰기 쉬운가요?

난이도는 중간 정도입니다. 설치 흐름 자체는 단순하지만, 초보자는 인증 문제, CLI 경로 문제, search·scrape·crawl 중 무엇을 써야 하는지 판단하는 부분에서 막힐 수 있습니다. 정확한 URL과 범위가 있는 타깃 중심으로 생각하기 시작하면 훨씬 쓰기 쉬워집니다.

firecrawl를 쓰려면 API key가 꼭 필요한가요?

항상 수동으로 넣어야 하는 것은 아니지만, 인증은 반드시 필요합니다. 권장 경로는 firecrawl login --browser입니다. 브라우저 인증이 불편한 경우 API key 로그인도 가능합니다.

언제 firecrawl 스킬을 쓰지 말아야 하나요?

다음 경우에는 건너뛰는 편이 좋습니다:

작업에 웹 의존성이 없다
기본 브라우징만으로 충분하다
공개 페이지 한 곳에서 아주 짧은 일부만 필요하고 재사용성도 중요하지 않다
대상 콘텐츠를 외부 스크래핑 서비스로 가져오면 안 된다

Web Scraping 용 firecrawl 사용 시 가장 큰 위험은 무엇인가요?

실무적으로 가장 큰 위험은 스크래핑된 콘텐츠를 신뢰 가능한 것으로 취급하는 것입니다. 웹페이지에는 prompt injection이 포함될 수 있고, 단순히 무관한 텍스트가 너무 많아 모델을 압도할 수도 있습니다. 이 스킬은 파일 출력, 점진적 읽기, 선택적 추출을 권장함으로써 그 위험을 줄입니다.

firecrawl 스킬 개선 방법

firecrawl 타깃 범위를 더 좁게 잡기

firecrawl 결과를 가장 빠르게 개선하는 방법은 모호함을 줄이는 것입니다. 더 좋은 입력은 보통 다음을 명시합니다:

정확한 URL 또는 도메인
페이지 집합의 경계
원하는 사실 또는 엔터티
제외 규칙
최종 산출물 형식

“이 문서 사이트를 크롤링해”는 너무 넓습니다. “인증과 rate-limit 섹션만 크롤링한 뒤 설정 단계를 비교해”처럼 요청하면 훨씬 나은 결과가 나옵니다.

단순 수집이 아니라 추출 목표를 함께 요청하기

firecrawl 스킬은 수집 작업이 의사결정 목적과 연결될 때 더 잘 작동합니다. 예를 들면:

“최신 가격 페이지를 찾아 플랜 제한을 추출해”
“이 changelog 페이지를 스크래핑해서 1월 이후 breaking changes를 요약해”
“이 docs 페이지들을 크롤링해서 webhook retry 규칙을 모두 나열해”

이렇게 하면 가져온 출력이 후속 필터링에 더 적합하고, 첫 실행 이후에도 더 바로 쓸 수 있습니다.

단계적 실행으로 출력 품질 높이기

규모가 큰 작업이라면 처음부터 가장 넓은 crawl로 시작하지 마세요. 더 나은 패턴은 다음과 같습니다:

대표성 있는 몇 개 페이지를 search 또는 scrape한다
콘텐츠 형태를 직접 확인한다
범위와 필드를 다듬는다
타깃이 명확해진 뒤에만 더 큰 crawl을 실행한다

이 방식은 credits를 절약하고 잡음이 많은 결과를 줄여줍니다.

가장 흔한 실패 패턴 피하기

자주 보이는 firecrawl 실패 패턴은 다음과 같습니다:

단일 scrape로 충분한데 crawl을 사용하는 경우
boilerplate 콘텐츠를 너무 많이 수집하는 경우
인증 확인을 빼먹는 경우
거대한 출력 파일을 그대로 컨텍스트에 읽어 넣는 경우
credit 한도를 고려하지 않는 경우
정확한 추출이 필요한데 URL 대신 주제만 주는 경우

이 문제의 대부분은 도구 품질보다 입력 품질의 문제입니다.

더 나은 firecrawl 사용을 위한 강한 프롬프트 쓰기

강한 프롬프트에는 보통 다음 요소가 모두 들어갑니다:

작업 유형
대상 URL 또는 주제
범위 경계
필요한 필드
출력 위치
가져온 뒤 수행할 분석 요청

예시:

Use the firecrawl skill to scrape `https://example.com/docs/api/auth`.
Save output to `.firecrawl/`.
Extract only authentication methods, required headers, token expiry details, and example request patterns.
Then summarize the findings in bullets and cite the source URL.

이 방식은 “이 docs 페이지 가져와”보다 훨씬 낫습니다.

첫 실행 후 반복 개선하기

첫 firecrawl 결과가 유용하지 않다면, 한 번에 한 변수씩 바꿔가며 개선하세요:

URL 집합을 좁힌다
crawl 대신 scrape로 바꾼다
중요하게 볼 섹션을 정확히 지정한다
이름 있는 필드 추출을 요청한다
최종 답변 형식을 바꾼다

작은 프롬프트 수정이 대개 일반적인 지시를 더 덧붙이는 것보다 효과가 좋습니다.

보안 패턴은 그대로 유지하기

원시 페이지 전체를 채팅에 붙여 넣는 방향으로 firecrawl 사용을 “개선”하지 마세요. 더 나은 경로는 다음과 같습니다:

결과를 .firecrawl/에 저장한다
일부만 확인한다
중요한 내용만 추출한다
원시 덤프 바깥에서 요약한다

이렇게 해야 이 스킬의 가장 큰 운영상 장점, 즉 컨텍스트 낭비를 줄이면서도 더 실용적이고 안전하게 웹 콘텐츠를 가져오는 패턴을 유지할 수 있습니다.

평점 및 리뷰

아직 평점이 없습니다

리뷰 남기기

이 스킬의 평점과 리뷰를 남기려면 로그인하세요.

0/10000

최신 리뷰

저장 중...

이 카테고리의 다른 스킬

huggingface-datasets

작성자 huggingface

Hugging Face Dataset Viewer API 작업에 이 huggingface-datasets 스킬을 사용해 데이터셋을 검증하고, split을 확인하며, 행을 미리 보고 페이지네이션하고, 텍스트를 검색하고, 필터를 적용하고, parquet 링크나 통계를 가져올 수 있습니다. 읽기 전용 데이터셋 탐색을 위한 실용적인 huggingface-datasets 가이드입니다.

Web Scraping

즐겨찾기 0GitHub 10.4k

data-scraper-agent

작성자 affaan-m

data-scraper-agent는 웹 스크래핑, 데이터 보강, 저장을 위한 반복 가능한 공개 데이터 파이프라인 구축을 돕습니다. GitHub Actions를 사용해 일정에 맞춰 작업, 가격, 뉴스, 저장소, 스포츠, 목록을 모니터링하도록 설계되었으며, 결과는 Notion, Sheets, 또는 Supabase로 보낼 수 있습니다. 일회성 추출보다는 지속적인 추적에 가장 적합합니다.

Web Scraping

즐겨찾기 0GitHub 156.1k

baoyu-url-to-markdown

작성자 JimLiu

baoyu-url-to-markdown은 Chrome CDP, 사이트별 어댑터, 범용 폴백을 활용해 실시간 URL을 Markdown으로 변환합니다. vendored baoyu-fetch CLI 기반으로 동작하며, Bun 런타임 요구사항, 최초 EXTEND.md 설정, 그리고 X, YouTube, Hacker News, 렌더링 페이지에서의 사용 방식까지 검토할 수 있습니다.

Format Conversion

즐겨찾기 0GitHub 13.2k

x-twitter-scraper

작성자 Xquik-dev

x-twitter-scraper를 사용해 X(Twitter) 데이터와 확인이 필요한 작업을 Xquik으로 조회하세요. 트윗 검색, 사용자 조회, 팔로워 추출, 미디어 다운로드, 모니터링, 웹훅, MCP, 쓰기 작업을 지원합니다. X 로그인 비밀정보가 아닌 API 키를 사용하는 웹 스크래핑형 조사에 가장 적합합니다.

Web Scraping

즐겨찾기 0GitHub 71

exa-search

작성자 K-Dense-AI

exa-search는 Exa로 구동되는 웹 리서치 스킬로, 최신 정보를 찾고 URL에서 콘텐츠를 추출하는 데 사용합니다. 검색, 출처 탐색, 기사 및 PDF 추출, 그리고 의미 기반 검색과 학술 스타일 필터링, 명확한 설치·사용 안내가 필요한 기술·과학 리서치에 적합합니다.

Web Research

즐겨찾기 0GitHub 0

browser-use

작성자 browser-use

browser-use는 페이지 열기, 상태 확인, 인덱스된 요소 클릭, 입력 필드 타이핑, 스크린샷 촬영, 그리고 지속형 브라우저 세션 재사용을 지원하는 브라우저 자동화 스킬입니다. browser-use CLI를 활용해 안정적인 폼 입력, 페이지 이동, 로그인 기반 워크플로에 적합합니다.

Browser Automation

즐겨찾기 0GitHub 84.9k

remote-browser

작성자 browser-use

remote-browser는 샌드박스 환경의 에이전트가 Browser Automation을 위해 헤드리스 브라우저를 제어할 수 있게 해주는 스킬입니다. 페이지 열기, 상태 확인, 인덱스 기반 요소 클릭, 입력 타이핑, 스크린샷 촬영은 물론 로컬 앱이나 CDP 기반 브라우저 세션 연결에도 사용할 수 있습니다.

Browser Automation

즐겨찾기 0GitHub 84.9k

firecrawl-search

작성자 firecrawl

firecrawl-search는 웹 리서치용 스킬로, 출처를 찾고 구조화된 검색을 수행하며, 필요하면 Firecrawl CLI로 전체 페이지 콘텐츠를 JSON으로 스크래핑할 수 있습니다.

Web Research

즐겨찾기 0GitHub 234

parallel-web

작성자 K-Dense-AI

parallel-web은 parallel-cli로 구동되는 웹 리서치 및 추출 스킬입니다. 웹 검색, URL 콘텐츠 추출, 출처 기반 데이터 보강, 그리고 학술·과학 자료를 우선하는 심층 리서치를 지원합니다. parallel-web 사용법, 웹 리서치, 인용, 증거 우선 워크플로에 활용하기 좋습니다.

Web Research

즐겨찾기 0GitHub 0

geomaster

작성자 K-Dense-AI

geomaster는 GIS, 원격탐사, 공간 분석, 지구 관측 워크플로를 위한 지리공간 과학 스킬입니다. 래스터·벡터 연산, 위성 이미지 처리, 공간 지표 산출, 워크플로 계획 같은 Data Analysis 작업에 활용할 수 있습니다. geomaster 가이드는 이 스킬을 더 적은 시행착오로 설치, 점검, 적용할 수 있도록 도와줍니다.

Data Analysis

즐겨찾기 0GitHub 0

asc-aso-audit

작성자 rudrankriyam

asc-aso-audit는 `./metadata`에 있는 정규 App Store 메타데이터를 대상으로 오프라인 ASO 감사를 실행한 뒤, Astro MCP로 키워드 공백을 찾아내는 데 도움을 줍니다. `asc metadata pull` 이후 asc-aso-audit skill을 사용하면 `subtitle`, `keywords`, `description`, `whatsNew`를 더 적은 추측으로 검토할 수 있습니다.

Data Analysis

즐겨찾기 0GitHub 0

ffuf-web-fuzzing

작성자 jthack

ffuf-web-fuzzing은 숨겨진 웹 콘텐츠를 찾고, 경로와 파라미터를 테스트하며, 원시 요청, 자동 보정, 결과 분석으로 인증된 대상을 퍼징하는 실용적인 스킬입니다. 침투 테스트와 Security Audit 워크플로우에서 반복해서 쓸 수 있는 ffuf-web-fuzzing 가이드가 필요한 보안 테스터에게 잘 맞습니다.

Security Audit

즐겨찾기 0GitHub 0

web-to-markdown

작성자 softaworks

web-to-markdown은 Format Conversion용 skill로, 로컬 `web2md` CLI를 사용해 실제 웹페이지를 깔끔한 Markdown으로 변환합니다. JS 렌더링 페이지, 상호작용이 필요한 흐름, 여러 URL의 일괄 변환까지 Chromium 계열 브라우저를 통해 처리할 수 있으며, 이름으로 명시적으로 호출될 때만 실행됩니다.

Format Conversion

즐겨찾기 0GitHub 1.3k

firecrawl-agent

작성자 firecrawl

firecrawl-agent는 복잡한 다중 페이지 웹사이트에서 구조화된 JSON을 추출할 때 유용합니다. 어떤 상황에서 적합한지, Firecrawl CLI agent를 실행하는 방법, schema 추가, 시작 URL 설정, 그리고 가격 정보·상품 목록·디렉터리형 데이터 추출 결과를 저장하는 방법까지 빠르게 파악할 수 있습니다.

Web Scraping

즐겨찾기 0GitHub 234

firecrawl-map

작성자 firecrawl

firecrawl-map은 사이트의 URL을 찾아 목록화할 때 유용한 스킬로, 더 깊은 scraping이나 crawling에 들어가기 전에 검색 필터링, 개수 제한, JSON 출력, sitemap 모드, 서브도메인 제어 같은 옵션을 활용할 수 있습니다.

Web Scraping

즐겨찾기 0GitHub 234

firecrawl-crawl

작성자 firecrawl

firecrawl-crawl은 path 필터, depth 제한, 페이지 수 상한, wait 모드, 작업 상태 확인을 통해 웹사이트나 docs 섹션의 콘텐츠를 대량으로 추출할 수 있게 도와주는 스킬입니다.

Web Scraping

즐겨찾기 0GitHub 234