firecrawl

bởi firecrawl

Kỹ năng firecrawl để cài đặt, xác thực và sử dụng Firecrawl CLI chính thức cho web scraping, tìm kiếm, crawling và tương tác với trang. Tìm hiểu cách thiết lập, chạy `firecrawl --status`, đăng nhập, ghi file an toàn vào `.firecrawl/` và các cách dùng thực tế dựa trên repo.

Stars234

Yêu thích0

Bình luận0

Đã thêm31 thg 3, 2026

Danh mụcWeb Scraping

Lệnh cài đặt

npx skills add firecrawl/cli --skill firecrawl

Điểm tuyển chọn

Kỹ năng này được chấm 78/100, tức là phù hợp để đưa vào danh mục cho người dùng cần một CLI tìm kiếm/web scraping có thể được agent kích hoạt, kèm hướng dẫn cài đặt và an toàn rõ ràng. Bằng chứng từ repository cho thấy tín hiệu kích hoạt rất tốt, kiểm tra điều kiện tiên quyết cụ thể và cách xử lý bảo mật thực tế, dù người dùng vẫn có thể phải dựa vào `--help` để xem đầy đủ chi tiết cách dùng lệnh.

78/100

Điểm mạnh

Khả năng kích hoạt rất tốt: SKILL.md nêu rõ khi nào nên dùng (tìm kiếm, scrape, crawl tài liệu, lấy URL, tương tác với trang) và khi nào không nên dùng.
Các bước vận hành cơ bản khá rõ ràng: tài liệu xác định các lệnh Bash được phép chạy, yêu cầu `firecrawl --status`, và có hướng dẫn cài đặt/xác thực trong `rules/install.md`.
Mức độ tin cậy và an toàn tốt hơn mặt bằng chung: `rules/security.md` đưa ra hướng dẫn cụ thể cho việc xử lý nội dung web không đáng tin cậy, cô lập đầu ra, đọc tăng dần và đặt URL trong dấu nháy.

Điểm cần lưu ý

Quy trình chạy lệnh mới chỉ được mô tả một phần trong chính skill; người dùng có thể cần xem `firecrawl --help` để biết chính xác tùy chọn và cách thực thi.
Hướng dẫn cài đặt/phiên bản hơi thiếu nhất quán giữa các tệp (`1.8.0` trong hướng dẫn cài đặt nhưng `1.7.1` trong đoạn cài đặt ở tài liệu bảo mật), điều này có thể gây chút cản trở khi bắt đầu dùng.

Cli Scraping Websites API Npm

Tổng quan

Tổng quan về skill firecrawl

Skill firecrawl làm được gì

Skill firecrawl giúp agent sử dụng Firecrawl CLI chính thức để tìm kiếm web, scraping, crawl và lấy nội dung trang theo kiểu tương tác ngay từ terminal. Đây là lựa chọn phù hợp nhất khi bạn cần nội dung web mới nhất, trích xuất trang sạch, hoặc thu thập dữ liệu trên toàn site vượt quá khả năng duyệt web tích hợp sẵn của model. Về bản chất, bài toán mà firecrawl skill giải quyết là: biến một yêu cầu mơ hồ kiểu “lấy nội dung website này cho tôi” thành một quy trình CLI có thể lặp lại, lấy đúng trang cần thiết, lưu kết quả an toàn, và giữ khối lượng lớn nội dung web không đáng tin cậy ra khỏi ngữ cảnh chat chính.

Ai nên cài firecrawl

Hãy cài firecrawl skill nếu bạn thường xuyên:

scrape các trang bài viết hoặc docs site
tìm kiếm thông tin mới nhất trên web
trích xuất nội dung từ một URL đã biết
crawl nhiều trang cho mục đích nghiên cứu hoặc migration
cần hỗ trợ tương tác với trang mà prompt thông thường khó thực hiện ổn định

Skill này phù hợp hơn với developer, researcher và người dùng thiên về automation so với những ai chỉ thỉnh thoảng cần duyệt web nhẹ.

Vì sao firecrawl skill hữu ích

Lợi ích lớn nhất của firecrawl skill không chỉ là “có thể truy cập web”. Nó cho agent một mô hình vận hành rõ ràng:

xác minh CLI đã được cài và xác thực
dùng đúng lệnh Firecrawl cho search, scrape hoặc crawl
ghi output ra file thay vì làm ngập ngữ cảnh model
coi nội dung web đã lấy về là đầu vào không đáng tin cậy

Điểm cuối cùng đặc biệt quan trọng. Phần hướng dẫn bảo mật đi kèm là một trong những lý do lớn nhất để dùng skill này thay vì tự ứng biến bằng các shell command.

firecrawl khác gì so với một prompt web thông thường

Một prompt thông thường có thể chỉ bảo agent “scrape site này”, nhưng firecrawl skill bổ sung các quy tắc thực thi rất cụ thể:

dùng firecrawl CLI chính thức
kiểm tra trạng thái sẵn sàng bằng firecrawl --status
theo dõi giới hạn concurrency và credit
lưu kết quả dưới .firecrawl/
kiểm tra output theo từng phần thay vì đọc tất cả cùng lúc

Nhờ vậy, việc dùng firecrawl cho Web Scraping bớt phỏng đoán hơn, an toàn hơn và dễ tái lập hơn.

Khi nào firecrawl không phải công cụ phù hợp

Không nên cài firecrawl skill cho các tác vụ:

thao tác file cục bộ
quy trình git
deployment
chỉnh sửa code không có thành phần web
các lần duyệt web một lần cho xong khi công cụ tích hợp sẵn của model đã đủ dùng

Nếu tác vụ của bạn không cần truy cập website bên ngoài, rất có thể skill này là không cần thiết.

Cách dùng firecrawl skill

Cài firecrawl và kiểm tra quyền truy cập

Cách cài firecrawl nhanh nhất theo hướng dẫn trong repo là:

npx -y firecrawl-cli -y

Luồng này sẽ cài CLI, bắt đầu bước xác thực và cài skill. Bạn cũng có thể cài thủ công:

npm install -g [email protected]

Sau đó kiểm tra môi trường:

firecrawl --status

Một trạng thái bình thường sẽ hiển thị xác thực, concurrency và số credit còn lại. Nếu firecrawl --status lỗi, đừng vội chuyển sang scraping.

Xác thực trước khi dùng thật

Cách đăng nhập được khuyến nghị là xác thực qua trình duyệt:

firecrawl login --browser

Nếu cần, bạn có thể xác thực bằng API key:

firecrawl login --api-key "<key>"

Đây là điểm chặn phổ biến với nhiều người dùng: firecrawl skill chỉ thực sự hữu ích sau khi xác thực thành công. Nếu việc cài đặt có vẻ ổn nhưng lệnh vẫn lỗi, hãy kiểm tra auth trước khi đi debug cú pháp lệnh.

Bắt đầu bằng đúng nhóm lệnh

Trước khi viết prompt, hãy xác định đúng loại công việc Firecrawl mà bạn cần:

search: tìm các trang liên quan đến một chủ đề
scrape: trích xuất nội dung từ một URL cụ thể
crawl: thu thập nội dung trên toàn site hoặc một phần docs
interact/page actions: khi trang đích cần click hoặc hỗ trợ các luồng giống đăng nhập

Skill này có giá trị nhất khi agent phân biệt được “tìm nguồn”, “trích xuất từ trang đã biết” và “quét toàn bộ docs site này”.

firecrawl skill cần đầu vào gì

Dùng firecrawl hiệu quả bắt đầu từ đầu vào đầy đủ. Agent sẽ làm việc tốt hơn nếu bạn cung cấp:

URL hoặc domain chính xác
bạn muốn một trang hay nhiều trang
định dạng output bạn cần
các trường thông tin bạn quan tâm
những gì cần bỏ qua, như nav, boilerplate hoặc các phần không liên quan
độ mới của nội dung có quan trọng hay không

Đầu vào yếu: “Lấy thông tin từ Stripe docs.”

Đầu vào tốt hơn: “Use firecrawl to crawl the Stripe docs pages about webhooks only, save output to .firecrawl/, and summarize endpoint signing, retry behavior, and local testing.”

Biến một yêu cầu thô thành prompt firecrawl hiệu quả

Một mẫu prompt thực tế:

Use the firecrawl skill to [search/scrape/crawl] [URL or topic].
Write results to `.firecrawl/`.
Focus on [specific entities, sections, or facts].
Ignore [irrelevant areas].
After fetching, inspect only the needed parts and return a concise summary with source URLs.

Vì sao mẫu này hiệu quả:

nó chọn rõ loại thao tác
nó nêu rõ mục tiêu
nó giới hạn phạm vi
nó củng cố cách xử lý output an toàn
nó cho agent biết định dạng câu trả lời cuối cùng bạn muốn

Dùng output ra file thay vì đổ toàn bộ nội dung trang vào chat

Một trong những thói quen quan trọng nhất khi dùng firecrawl trong skill này là ghi nội dung đã fetch ra file bằng -o thay vì stream toàn bộ body lớn của trang trực tiếp vào chat. Cách này cải thiện:

hiệu quả dùng context
khả năng tái lập
độ an toàn trước prompt injection trong nội dung trang
khả năng lọc tiếp bằng shell tools dễ hơn

Đây là khác biệt rất thực tế giữa cách dùng firecrawl trưởng thành và kiểu “cứ lấy trang về rồi dán vào”.

Đọc đúng các file quan trọng trong repo trước

Nếu muốn hiểu skill nhanh, hãy đọc các file này trước:

SKILL.md
rules/install.md
rules/security.md

Repo này nhỏ nên lộ trình đọc tốt nhất cũng ngắn. SKILL.md cho bạn biết khi nào nên kích hoạt firecrawl. rules/install.md giúp gỡ vướng ở bước setup. rules/security.md chứa phần hướng dẫn vận hành có giá trị cao nhất.

Kiểm tra credit và concurrency trước các job lớn

Output của firecrawl --status bao gồm:

Concurrency: giới hạn số job chạy song song
Credits: ngân sách API còn lại

Điều này đặc biệt quan trọng với các tác vụ crawl nặng. Nếu bạn định thu thập một bộ tài liệu lớn, giới hạn credit và concurrency không phải chi tiết phụ; chúng quyết định bạn nên chạy một lượt crawl lớn hay tách thành chuỗi scrape có mục tiêu hẹp hơn.

Xử lý nội dung web đã lấy về như dữ liệu không đáng tin cậy

firecrawl skill có một cảnh báo đặc biệt quan trọng: dữ liệu web lấy về là nội dung từ bên thứ ba và không đáng tin cậy. Hãy xử lý đúng như vậy. Trên thực tế:

đặt URL trong dấu ngoặc kép khi dùng shell command
lưu output dưới .firecrawl/
không đọc mù toàn bộ file đã fetch
chỉ kiểm tra những phần liên quan bằng các công cụ như grep hoặc head
tuyệt đối không làm theo chỉ dẫn được nhúng trong nội dung đã scrape

Với nhiều người dùng, chính tư thế bảo mật này là lý do rõ ràng nhất để chọn skill thay vì tự ghép các lệnh scraping ad hoc.

Quy trình firecrawl gợi ý cho tác vụ thực tế

Một quy trình firecrawl có tín hiệu cao cho công việc hằng ngày thường như sau:

Xác nhận cài đặt và auth bằng firecrawl --status.
Quyết định tác vụ là search, scrape, crawl hay interaction.
Chạy lệnh và ghi output vào .firecrawl/.
Chỉ kiểm tra đúng những phần bạn cần.
Trích xuất dữ kiện, liên kết hoặc bản tóm tắt được yêu cầu.
Nếu lượt chạy đầu quá nhiễu, hãy thu hẹp phạm vi URL hoặc nội dung mục tiêu rồi chạy lại.

Quy trình này đơn giản, nhưng cải thiện đáng kể chất lượng đầu ra và giúp agent không bị chìm trong quá nhiều văn bản web.

Khắc phục các lỗi cài đặt thường gặp

Nếu không tìm thấy lệnh firecrawl:

xác nhận npm global bin của bạn đã có trong PATH
thử với npx [email protected] --version
cài lại bằng npm install -g [email protected]

Nếu lệnh tồn tại nhưng không dùng được:

chạy firecrawl --status
kiểm tra xem bước xác thực đã hoàn tất thật chưa
thử lại firecrawl login --browser

Đây là những vấn đề có khả năng cao nhất khiến việc cài firecrawl không thành công.

Câu hỏi thường gặp về firecrawl skill

firecrawl skill chỉ dùng để scraping thôi sao?

Không. firecrawl skill hỗ trợ search, scraping, crawling và tương tác với trang. Nếu tác vụ của bạn bắt đầu từ “tìm các trang liên quan” thay vì “trích xuất URL chính xác này”, nó vẫn rất phù hợp.

firecrawl có tốt hơn một prompt duyệt web thông thường không?

Thường là có, khi bạn cần trích xuất có thể lặp lại, thu thập nhiều trang, output dựa trên file hoặc quy trình chạy bằng CLI. Prompt thông thường vẫn ổn cho các nhu cầu tra cứu nhẹ. Firecrawl tốt hơn khi bạn cần lấy dữ liệu web có cấu trúc, có thể chạy lại hoặc kiểm tra cục bộ.

firecrawl skill có thân thiện với người mới không?

Ở mức vừa phải. Luồng cài đặt khá thẳng, nhưng người mới có thể bị chặn ở bước xác thực, vấn đề đường dẫn CLI hoặc không rõ nên search, scrape hay crawl. Skill này dễ dùng hơn khi bạn bắt đầu nghĩ theo URL cụ thể và phạm vi mục tiêu rõ ràng.

Tôi có cần API key cho firecrawl không?

Không phải lúc nào cũng phải nhập thủ công, nhưng bạn chắc chắn cần xác thực. Cách được khuyến nghị là firecrawl login --browser. Đăng nhập bằng API key vẫn khả dụng nếu xác thực qua trình duyệt không thuận tiện.

Khi nào không nên dùng firecrawl skill?

Hãy bỏ qua nếu:

tác vụ không phụ thuộc vào web
khả năng duyệt web tích hợp sẵn đã đủ
bạn chỉ cần một mẩu rất nhỏ từ một trang public và không quan tâm đến khả năng tái sử dụng
nội dung đích không nên được fetch qua một dịch vụ scraping bên ngoài

Rủi ro chính khi dùng firecrawl cho Web Scraping là gì?

Rủi ro thực tế lớn nhất là coi nội dung đã scrape như dữ liệu đáng tin. Các trang web có thể chứa prompt injection hoặc đơn giản là làm model quá tải bằng lượng văn bản không liên quan. Skill này xử lý vấn đề đó bằng cách khuyến nghị ghi output ra file, đọc tăng dần từng phần và chỉ trích xuất phần cần thiết.

Cách cải thiện firecrawl skill

Cho firecrawl mục tiêu hẹp hơn

Cách nhanh nhất để cải thiện kết quả firecrawl là giảm độ mơ hồ. Đầu vào tốt hơn nên chỉ rõ:

URL hoặc domain chính xác
ranh giới tập trang
dữ kiện hoặc thực thể cần lấy
quy tắc loại trừ
định dạng đầu ra cuối cùng

“Crawl site tài liệu này” là quá rộng. “Chỉ crawl các phần authentication và rate-limit, rồi so sánh các bước setup” sẽ cho kết quả tốt hơn nhiều.

Yêu cầu mục tiêu trích xuất, không chỉ yêu cầu lấy dữ liệu

firecrawl skill hoạt động tốt hơn khi việc lấy dữ liệu gắn với một mục tiêu ra quyết định. Ví dụ:

“Find the latest pricing page and extract plan limits”
“Scrape this changelog page and summarize breaking changes since January”
“Crawl these docs pages and list all webhook retry rules”

Cách này giúp output đã fetch dễ lọc hơn và hữu ích hơn ngay sau lượt chạy đầu tiên.

Cải thiện chất lượng output bằng các lần chạy theo giai đoạn

Với các job lớn, đừng bắt đầu bằng lượt crawl rộng nhất. Mẫu tốt hơn là:

search hoặc scrape một vài trang đại diện
kiểm tra xem nội dung thực tế trông như thế nào
tinh chỉnh phạm vi và các trường cần lấy
chỉ chạy crawl lớn khi mục tiêu đã rõ ràng

Cách này giúp tiết kiệm credit và giảm kết quả nhiễu.

Tránh các kiểu thất bại phổ biến nhất

Các lỗi firecrawl thường gặp gồm:

dùng crawl trong khi chỉ cần một lần scrape
thu thập quá nhiều nội dung boilerplate
quên kiểm tra auth
nạp các file output khổng lồ vào context
không tính đến giới hạn credit
đưa chủ đề thay vì URL khi cần trích xuất chính xác

Phần lớn trong số này là vấn đề chất lượng đầu vào, không phải vấn đề chất lượng công cụ.

Dùng prompt mạnh hơn để dùng firecrawl hiệu quả hơn

Một prompt tốt hơn thường bao gồm đầy đủ các yếu tố sau:

loại thao tác
URL hoặc chủ đề mục tiêu
ranh giới phạm vi
các trường bắt buộc
vị trí lưu output
yêu cầu phân tích sau khi fetch

Ví dụ:

Use the firecrawl skill to scrape `https://example.com/docs/api/auth`.
Save output to `.firecrawl/`.
Extract only authentication methods, required headers, token expiry details, and example request patterns.
Then summarize the findings in bullets and cite the source URL.

Mẫu này tốt hơn nhiều so với “Fetch this docs page.”

Lặp lại sau lần chạy đầu tiên

Nếu kết quả firecrawl đầu tiên chưa hữu ích, hãy chỉ điều chỉnh từng biến một:

thu hẹp tập URL
chuyển từ crawl sang scrape
chỉ rõ chính xác các phần bạn quan tâm
yêu cầu trích xuất các trường có tên
đổi định dạng câu trả lời cuối cùng

Những tinh chỉnh nhỏ trong prompt thường hiệu quả hơn việc thêm nhiều chỉ dẫn chung chung.

Giữ nguyên mô hình bảo mật

Đừng “cải thiện” cách dùng firecrawl bằng cách dán toàn bộ trang thô vào chat. Cách tốt hơn là:

output vào .firecrawl/
kiểm tra từng phần nội dung
chỉ trích xuất những gì quan trọng
tóm tắt bên ngoài phần raw dump

Cách này giữ được ưu thế vận hành chính của skill: lấy dữ liệu web thực tế, an toàn hơn và ít lãng phí context hơn.

Đánh giá & nhận xét

Chưa có đánh giá nào

Chia sẻ nhận xét của bạn

Đăng nhập để chấm điểm và để lại nhận xét cho skill này.

0/10000

Nhận xét mới nhất

Đang lưu...

Thêm skill trong danh mục này

huggingface-datasets

bởi huggingface

Dùng skill huggingface-datasets cho các quy trình với Hugging Face Dataset Viewer API để xác thực dataset, xử lý split, xem trước và phân trang các hàng, tìm kiếm văn bản, áp dụng bộ lọc, và lấy liên kết parquet hoặc thống kê. Đây là hướng dẫn thực dụng về huggingface-datasets cho việc khám phá dataset chỉ đọc.

Web Scraping

Yêu thích 0GitHub 10.4k

data-scraper-agent

bởi affaan-m

data-scraper-agent giúp xây dựng một pipeline dữ liệu công khai có thể lặp lại cho web scraping, làm giàu dữ liệu và lưu trữ. Skill này được thiết kế để theo dõi theo lịch các job, giá cả, tin tức, repo, thể thao và danh sách bằng GitHub Actions, với đầu ra đẩy tới Notion, Sheets hoặc Supabase. Phù hợp nhất cho việc theo dõi liên tục, không phải trích xuất một lần.

Web Scraping

Yêu thích 0GitHub 156.1k

baoyu-url-to-markdown

bởi JimLiu

baoyu-url-to-markdown chuyển URL đang hoạt động thành Markdown bằng CLI baoyu-fetch đi kèm, sử dụng Chrome CDP, adapter theo từng trang và cơ chế dự phòng chung. Tìm hiểu yêu cầu Bun runtime, thiết lập EXTEND.md cho lần dùng đầu, và cách dùng với X, YouTube, Hacker News cùng các trang đã render.

Format Conversion

Yêu thích 0GitHub 13.2k

x-twitter-scraper

bởi Xquik-dev

Dùng x-twitter-scraper để lấy dữ liệu X (Twitter) và các tác vụ có xác nhận qua Xquik. Skill này hỗ trợ tìm kiếm tweet, tra cứu người dùng, trích xuất follower, tải media, monitors, webhooks, MCP và các tác vụ ghi. Phù hợp nhất cho nghiên cứu kiểu web scraping với API key, không phải với thông tin đăng nhập X.

Web Scraping

Yêu thích 0GitHub 71

exa-search

bởi K-Dense-AI

exa-search là một skill nghiên cứu web được hỗ trợ bởi Exa, dùng để tìm thông tin mới nhất và trích xuất nội dung từ các URL. Hãy dùng nó cho tìm kiếm, khám phá nguồn, trích xuất bài viết và PDF, cũng như nghiên cứu kỹ thuật hoặc khoa học với truy xuất ngữ nghĩa, lọc kiểu học thuật và hướng dẫn cài đặt, sử dụng rõ ràng.

Web Research

Yêu thích 0GitHub 0

browser-use

bởi browser-use

browser-use là skill tự động hóa trình duyệt dùng để mở trang, kiểm tra trạng thái, nhấp vào các phần tử theo chỉ mục, nhập liệu vào trường, chụp màn hình và tái sử dụng phiên trình duyệt liên tục. Phù hợp cho điền biểu mẫu ổn định, điều hướng và các quy trình cần đăng nhập bằng browser-use CLI.

Browser Automation

Yêu thích 0GitHub 84.9k

remote-browser

bởi browser-use

remote-browser giúp các agent chạy trong môi trường sandbox điều khiển trình duyệt headless cho Browser Automation. Dùng để mở trang, kiểm tra trạng thái, nhấp vào phần tử theo chỉ mục, nhập liệu, chụp ảnh màn hình và kết nối với ứng dụng cục bộ hoặc các phiên trình duyệt dùng CDP.

Browser Automation

Yêu thích 0GitHub 84.9k

firecrawl-search

bởi firecrawl

firecrawl-search là skill nghiên cứu web giúp tìm nguồn, chạy tìm kiếm có cấu trúc và tùy chọn trích xuất toàn bộ nội dung trang dưới dạng JSON bằng Firecrawl CLI.

Web Research

Yêu thích 0GitHub 234

parallel-web

bởi K-Dense-AI

parallel-web là một skill nghiên cứu và trích xuất nội dung web được hỗ trợ bởi parallel-cli. Skill này giúp bạn tìm kiếm web, trích xuất nội dung từ URL, làm giàu dữ liệu từ các nguồn, và thực hiện nghiên cứu chuyên sâu với ưu tiên cho nguồn học thuật và khoa học. Phù hợp khi bạn cần dùng parallel-web, nghiên cứu web, trích dẫn, và các quy trình làm việc ưu tiên bằng chứng.

Web Research

Yêu thích 0GitHub 0

geomaster

bởi K-Dense-AI

geomaster là một skill khoa học địa không gian dành cho GIS, viễn thám, phân tích không gian và các quy trình quan trắc Trái Đất. Hãy dùng nó cho các tác vụ Phân tích Dữ liệu như thao tác raster và vector, xử lý ảnh vệ tinh, chỉ số không gian và lập kế hoạch quy trình làm việc. Hướng dẫn geomaster giúp bạn cài đặt, xem xét và áp dụng skill này với ít phải đoán mò hơn.

Data Analysis

Yêu thích 0GitHub 0

asc-aso-audit

bởi rudrankriyam

asc-aso-audit giúp bạn thực hiện audit ASO ngoại tuyến trên metadata App Store chuẩn trong `./metadata`, rồi phát hiện khoảng trống từ khóa với Astro MCP. Hãy dùng kỹ năng asc-aso-audit sau `asc metadata pull` để rà soát `subtitle`, `keywords`, `description` và `whatsNew` với ít phải đoán mò hơn.

Data Analysis

Yêu thích 0GitHub 0

ffuf-web-fuzzing

bởi jthack

ffuf-web-fuzzing là một kỹ năng thực dụng để phát hiện nội dung web ẩn, kiểm tra route và tham số, đồng thời fuzz các mục tiêu đã xác thực bằng raw request, tự hiệu chuẩn và phân tích kết quả. Kỹ năng này phù hợp với người kiểm thử bảo mật cần một hướng dẫn ffuf-web-fuzzing có thể lặp lại cho kiểm thử xâm nhập và quy trình Security Audit.

Security Audit

Yêu thích 0GitHub 0

web-to-markdown

bởi softaworks

web-to-markdown là skill Format Conversion dùng để chuyển các trang web đang hoạt động thành Markdown sạch thông qua CLI `web2md` cục bộ, sử dụng trình duyệt họ Chromium cho các trang render bằng JS, luồng tương tác và chuyển đổi hàng loạt URL. Skill chỉ chạy khi được gọi đích danh.

Format Conversion

Yêu thích 0GitHub 1.3k

firecrawl-agent

bởi firecrawl

firecrawl-agent giúp trích xuất JSON có cấu trúc từ các website phức tạp, nhiều trang. Tìm hiểu khi nào nên dùng, cách chạy tác nhân Firecrawl CLI, thêm schema, đặt URL bắt đầu và lưu đầu ra để trích xuất dữ liệu về giá, sản phẩm và các danh mục dạng directory.

Web Scraping

Yêu thích 0GitHub 234

firecrawl-map

bởi firecrawl

firecrawl-map giúp agent khám phá và liệt kê URL trên một website, với các tùy chọn lọc tìm kiếm, giới hạn, xuất JSON, chế độ sitemap và kiểm soát subdomain trước khi scrape hoặc crawl sâu hơn.

Web Scraping

Yêu thích 0GitHub 234

firecrawl-crawl

bởi firecrawl

firecrawl-crawl giúp agent trích xuất nội dung hàng loạt từ một website hoặc mục tài liệu, với bộ lọc đường dẫn, giới hạn độ sâu, giới hạn số trang, chế độ chờ và kiểm tra trạng thái job.

Web Scraping

Yêu thích 0GitHub 234