Web Scraping

Kham pha Agent Skill cho Web Scraping trong Xu ly du lieu va so sanh workflow, cong cu va tinh huong lien quan.

10 skills
B
remote-browser

by browser-use

remote-browser giúp các agent chạy trong môi trường sandbox điều khiển trình duyệt headless cho Browser Automation. Dùng để mở trang, kiểm tra trạng thái, nhấp vào phần tử theo chỉ mục, nhập liệu, chụp ảnh màn hình và kết nối với ứng dụng cục bộ hoặc các phiên trình duyệt dùng CDP.

Browser Automation
Favorites 0GitHub 84.9k
B
browser-use

by browser-use

browser-use là skill tự động hóa trình duyệt dùng để mở trang, kiểm tra trạng thái, nhấp vào các phần tử theo chỉ mục, nhập liệu vào trường, chụp màn hình và tái sử dụng phiên trình duyệt liên tục. Phù hợp cho điền biểu mẫu ổn định, điều hướng và các quy trình cần đăng nhập bằng browser-use CLI.

Browser Automation
Favorites 0GitHub 84.9k
F
firecrawl-agent

by firecrawl

firecrawl-agent giúp trích xuất JSON có cấu trúc từ các website phức tạp, nhiều trang. Tìm hiểu khi nào nên dùng, cách chạy tác nhân Firecrawl CLI, thêm schema, đặt URL bắt đầu và lưu đầu ra để trích xuất dữ liệu về giá, sản phẩm và các danh mục dạng directory.

Web Scraping
Favorites 0GitHub 234
F
firecrawl-browser

by firecrawl

firecrawl-browser là một skill Firecrawl cho tự động hóa web tương tác. Skill này đã bị ngừng dùng như một lệnh trình duyệt độc lập và hiện hướng người dùng sang cách dùng firecrawl scrape kết hợp firecrawl interact cho thao tác nhấp, điền biểu mẫu, quy trình đăng nhập, phân trang và các trang nặng JavaScript.

Browser Automation
Favorites 0GitHub 234
F
firecrawl

by firecrawl

Kỹ năng firecrawl để cài đặt, xác thực và sử dụng Firecrawl CLI chính thức cho web scraping, tìm kiếm, crawling và tương tác với trang. Tìm hiểu cách thiết lập, chạy `firecrawl --status`, đăng nhập, ghi file an toàn vào `.firecrawl/` và các cách dùng thực tế dựa trên repo.

Web Scraping
Favorites 0GitHub 234
F
firecrawl-crawl

by firecrawl

firecrawl-crawl giúp agent trích xuất nội dung hàng loạt từ một website hoặc mục tài liệu, với bộ lọc đường dẫn, giới hạn độ sâu, giới hạn số trang, chế độ chờ và kiểm tra trạng thái job.

Web Scraping
Favorites 0GitHub 234
F
firecrawl-download

by firecrawl

firecrawl-download giúp bạn tải toàn bộ website hoặc một phần tài liệu thành các tệp cục bộ được sắp xếp gọn trong `.firecrawl/`. Skill này kết hợp lập bản đồ website và thu thập nội dung, hỗ trợ markdown, liên kết và ảnh chụp màn hình, phù hợp để lưu bản sao tài liệu ngoại tuyến, thu thập hàng loạt trang và triển khai các quy trình Web Scraping thực tế.

Web Scraping
Favorites 0GitHub 234
F
firecrawl-search

by firecrawl

firecrawl-search là skill nghiên cứu web giúp tìm nguồn, chạy tìm kiếm có cấu trúc và tùy chọn trích xuất toàn bộ nội dung trang dưới dạng JSON bằng Firecrawl CLI.

Web Research
Favorites 0GitHub 234
F
firecrawl-map

by firecrawl

firecrawl-map giúp agent khám phá và liệt kê URL trên một website, với các tùy chọn lọc tìm kiếm, giới hạn, xuất JSON, chế độ sitemap và kiểm soát subdomain trước khi scrape hoặc crawl sâu hơn.

Web Scraping
Favorites 0GitHub 234
F
firecrawl-scrape

by firecrawl

firecrawl-scrape giúp trích xuất nội dung sạch, thân thiện với LLM từ các URL đã biết, כולל cả trang được render bằng JS. Dùng kỹ năng này để scrape markdown, liên kết hoặc lấy câu trả lời theo từng trang bằng Firecrawl CLI hoặc `npx firecrawl`.

Web Scraping
Favorites 0GitHub 234