remote-browser

bởi browser-use

remote-browser giúp các agent chạy trong môi trường sandbox điều khiển trình duyệt headless cho Browser Automation. Dùng để mở trang, kiểm tra trạng thái, nhấp vào phần tử theo chỉ mục, nhập liệu, chụp ảnh màn hình và kết nối với ứng dụng cục bộ hoặc các phiên trình duyệt dùng CDP.

Stars84.9k

Yêu thích0

Bình luận0

Đã thêm29 thg 3, 2026

Danh mụcBrowser Automation

Lệnh cài đặt

npx skills add browser-use/browser-use --skill remote-browser

Điểm tuyển chọn

Skill này đạt 78/100, cho thấy đây là một mục phù hợp để đưa vào danh bạ: agent có điều kiện kích hoạt rõ ràng, quy trình lệnh cụ thể và khả năng điều khiển trình duyệt thực tế trong môi trường sandbox. Tuy vậy, người triển khai vẫn cần xem thêm tài liệu thiết lập bên ngoài để cài đặt và nắm một số chi tiết về môi trường.

78/100

Điểm mạnh

Khả năng kích hoạt tốt: phần mô tả xác định rõ trường hợp dùng cho agent chạy trong sandbox/từ xa cần điều hướng web, điền biểu mẫu, chụp ảnh màn hình hoặc mở truy cập qua tunnel.
Quy trình vận hành cụ thể: `SKILL.md` cung cấp vòng thao tác từng bước với `open`, `state`, các hành động theo chỉ mục như `click`/`input`, bước xác minh và `close`.
Mang lại giá trị vận hành rõ rệt hơn một prompt chung chung nhờ mô tả nhiều chế độ kết nối, cách chạy headless và khả năng duy trì phiên trình duyệt qua nhiều lệnh.

Điểm cần lưu ý

Phần cài đặt/thiết lập chưa tự đầy đủ trong skill; nội dung chỉ trỏ sang README của CLI bên ngoài và không có lệnh cài đặt trong `SKILL.md`.
Tài liệu hỗ trợ còn mỏng: không kèm script, tài liệu tham chiếu, quy tắc hay tài nguyên bổ trợ, nên việc xử lý sự cố và các tình huống biên có thể phải tự suy đoán nhiều hơn.

Agent Browser Sandbox Chrome Chrome Devtools Protocol Cli Automation Testing

Tổng quan

Tổng quan về skill remote-browser

Skill remote-browser được tạo ra để giải quyết một bài toán rất cụ thể nhưng cực kỳ phổ biến: agent của bạn đang chạy trên máy từ xa hoặc trong môi trường sandbox, không có trình duyệt desktop thông thường, nhưng vẫn cần thực hiện Browser Automation thật sự. Thay vì phụ thuộc vào những prompt duyệt web mơ hồ, remote-browser cung cấp một quy trình điều khiển bằng lệnh để mở trang, kiểm tra trạng thái trang, nhấp vào các phần tử theo chỉ số, nhập dữ liệu vào ô, chụp ảnh màn hình và đóng phiên làm việc gọn gàng.

Ai nên dùng skill remote-browser nhất

Skill remote-browser đặc biệt phù hợp với những người dùng:

chạy agent trong CI, cloud VM, dev container hoặc sandbox coding được host sẵn
cần tương tác với trang web một cách đáng tin cậy, không chỉ lấy nội dung web dạng văn bản
muốn các bước Browser Automation có thể lặp lại được như luồng đăng nhập, điền biểu mẫu, kiểm tra điều hướng và xác thực UI
có thể cần expose local dev server qua tunnel rồi kiểm tra nó từ phiên trình duyệt

Nếu bạn đã có một trình duyệt tương tác cục bộ và có thể tự nhấp thủ công, giá trị của skill này sẽ thấp hơn. remote-browser phát huy hiệu quả nhất khi agent gần như “mù” nếu bạn không cấp quyền điều khiển trình duyệt một cách rõ ràng.

Nhu cầu thực sự mà skill này giải quyết

Người dùng không cài remote-browser chỉ để “mở trình duyệt”. Họ cài nó để agent có thể hoàn thành các tác vụ web từ môi trường không có GUI với ít phỏng đoán hơn:

mở URL mục tiêu
kiểm tra xem thực tế có gì có thể nhấp hoặc nhập dữ liệu
thao tác trên các chỉ số phần tử ổn định
xác minh kết quả sau mỗi hành động
giữ phiên trình duyệt sống qua nhiều lệnh

Vì vậy, trong môi trường từ xa nơi tương tác có trạng thái là yếu tố quan trọng, nó thực tế hơn nhiều so với một prompt chung chung kiểu “hãy duyệt trang này giúp tôi”.

remote-browser khác gì so với prompt duyệt web thông thường

Điểm khác biệt chính của remote-browser là nó xoay quanh các lệnh trình duyệt rõ ràng và việc kiểm tra trạng thái trang, thay vì duyệt web bằng ngôn ngữ tự nhiên theo kiểu mơ hồ. Quy trình được tài liệu hóa là:

mở một trang
kiểm tra trạng thái hiện tại
tương tác bằng phần tử theo chỉ số
xác minh
lặp lại

Cấu trúc này khá đơn giản, nhưng chính nó giúp giảm các lỗi như nhấp sai, thao tác vào phần tử bị ẩn, hoặc “ảo tưởng” sai về giao diện.

Những điều quan trọng cần biết trước khi dùng

Trước khi dùng skill remote-browser, bạn nên biết:

nó phụ thuộc vào việc công cụ browser-use có sẵn trong môi trường
skill này được thiết kế cho agent chạy trong sandbox, không chủ yếu dành cho việc duyệt web thủ công trên máy local
nó hoạt động tốt nhất khi bạn điều khiển theo từng bước lặp, thay vì yêu cầu một chuỗi duyệt web tự động dài trong một lần
phiên làm việc được giữ lại giữa các lệnh, rất hữu ích cho các luồng nhiều bước
có bước kiểm tra tiền điều kiện thiết lập qua browser-use doctor

Cách dùng skill remote-browser

Ngữ cảnh cài đặt cho remote-browser

Mẫu thư mục cơ bản để thêm skill là:

npx skills add https://github.com/browser-use/browser-use --skill remote-browser

Sau khi thêm xong, hãy xác nhận môi trường thực thi thực sự dùng được công cụ trình duyệt bên dưới. Skill này tự dẫn tới:

browser-use doctor

Hãy chạy lệnh đó trước nếu các lệnh trình duyệt bị lỗi hoặc môi trường vừa mới được khởi tạo. Với chi tiết thiết lập ngoài trang skill, repository trỏ tới:

browser_use/skill_cli/README.md

remote-browser cần gì từ môi trường của bạn

Để remote-browser hoạt động tốt, agent thường cần:

quyền truy cập vào browser-use CLI
quyền chạy các lệnh trình duyệt được cho phép
quyền truy cập mạng tới website đích
một URL mục tiêu có thể truy cập được, dù là public, local qua tunnel, hay qua kết nối CDP/cloud browser

Nếu tác vụ của bạn liên quan đến một ứng dụng localhost đang chạy trong sandbox, hãy chắc chắn rằng bạn có thể expose nó trước khi yêu cầu agent kiểm thử trên trình duyệt. Nếu không, skill sẽ không thể chạm tới trang mà bạn thực sự muốn kiểm tra.

Lộ trình đọc repository nhanh nhất

Nếu bạn muốn đi theo con đường ngắn nhất để dùng hiệu quả, hãy đọc theo thứ tự:

skills/remote-browser/SKILL.md
browser_use/skill_cli/README.md để nắm cài đặt và chi tiết môi trường
các tài liệu rộng hơn của repo chỉ khi bạn vẫn chưa rõ về cách thiết lập môi trường

Đây là một skill nhỏ, nên phần đáng đọc nhất là quy trình lệnh và các tùy chọn chế độ trình duyệt, chứ không phải lướt toàn bộ repo một cách dàn trải.

Mẫu sử dụng remote-browser cốt lõi

Vòng lặp remote-browser usage thực tế là:

browser-use open <url>
browser-use state
browser-use click <index>
browser-use input <index> "text"
browser-use screenshot
browser-use close

Bước quan trọng nhất là browser-use state. Hãy dùng nó giữa các thao tác để agent làm việc dựa trên cấu trúc trang hiện tại, thay vì giả định rằng nút bấm hoặc ô nhập vẫn nằm nguyên vị trí cũ sau khi điều hướng.

Các chế độ trình duyệt ảnh hưởng trực tiếp đến quyết định cài đặt

Skill remote-browser hỗ trợ nhiều hơn một chế độ kết nối, và đây là điểm rất quan trọng khi quyết định có nên dùng hay không:

browser-use open <url>
browser-use cloud connect
browser-use --connect open <url>
browser-use --cdp-url ws://localhost:9222/... open <url>

Trong thực tế:

dùng open mặc định nếu luồng headless Chromium là đủ
dùng cloud connect khi bạn cần một môi trường trình duyệt được cấp sẵn
dùng --connect hoặc --cdp-url khi bạn đã có sẵn một trình duyệt được expose qua CDP

Đây là một trong những điểm ra quyết định quan trọng nhất: nếu tổ chức của bạn đã vận hành sẵn các trình duyệt được quản lý, cách dùng qua CDP có thể phù hợp hơn việc khởi tạo một phiên trình duyệt mới.

Dữ liệu đầu vào nào giúp remote-browser chạy tốt hơn

Một yêu cầu yếu là:

“Hãy vào test website rồi cho tôi biết nó có chạy không.”

Một yêu cầu mạnh là:

“Use the remote-browser skill to open https://example.com/login, inspect page state, sign in with the provided test account, navigate to Settings, verify the Save button is clickable, take a screenshot after saving, and report any blocking UI errors.”

Dữ liệu đầu vào tốt hơn thường bao gồm:

URL chính xác
mục tiêu tác vụ
thông tin đăng nhập hoặc test data nếu cần
điều kiện thành công
có cần ảnh chụp màn hình hoặc xác minh trạng thái cuối hay không
các ràng buộc như “không gửi form cuối cùng”

Nhờ vậy, skill này trở thành một bộ thực thi tác vụ có kiểm soát, thay vì Browser Automation kiểu chung chung.

Cách biến một mục tiêu thô thành prompt hoàn chỉnh

Một mẫu prompt thực tế cho remote-browser for Browser Automation là:

environment: agent đang chạy ở đâu
target: URL hoặc điểm vào của ứng dụng
task: hành trình người dùng cần thực hiện
guardrails: các hành động cần tránh
evidence: ảnh chụp màn hình, trạng thái cuối hoặc đầu ra xác minh cụ thể

Ví dụ:

Use the remote-browser skill. The agent is running in a sandbox. Open http://localhost:3000 through the available tunnel, inspect the page state before each action, log in with the supplied test account, create one sample record, confirm the success message appears, and take a screenshot at the end. Do not delete existing data.

Cách này hiệu quả hơn vì nó không chỉ nói agent phải làm gì, mà còn chỉ rõ cách xác minh tiến trình.

Quy trình từng bước được khuyến nghị

Với hầu hết tác vụ, hãy giữ workflow ngắn gọn và rõ ràng:

xác minh môi trường bằng browser-use doctor nếu cần
mở trang mục tiêu
kiểm tra trạng thái trước lần tương tác đầu tiên
thực hiện từng hành động một bằng chỉ số
kiểm tra lại trạng thái sau mỗi thay đổi trang quan trọng
chụp ảnh màn hình ở các mốc kiểm tra
đóng trình duyệt khi hoàn tất

Cách này tốt hơn nhiều so với việc cố nén cả một phiên duyệt web vào một prompt khổng lồ.

Mẹo thực tế giúp giảm lỗi với remote-browser

Các mẹo có tác động lớn cho remote-browser guide:

luôn yêu cầu state trước khi nhấp nếu trang có thể đã thay đổi
ưu tiên các vòng tương tác ngắn thay vì chạy tự động kéo dài
yêu cầu ảnh chụp ở các mốc quan trọng, không chỉ đến cuối mới chụp
nêu rõ tác vụ có phải dừng trước các hành động mang tính phá hủy hay không
nếu đang dùng ứng dụng local, hãy xác nhận ứng dụng thực sự truy cập được từ ngữ cảnh trình duyệt

Phần lớn lỗi đến từ cách đóng khung tác vụ chưa tốt, chứ không phải từ chính các lệnh click hay input.

Những loại tác vụ mà remote-browser đặc biệt phù hợp

Skill remote-browser đặc biệt hữu ích cho:

smoke test đăng nhập và xác thực
luồng điền và gửi biểu mẫu
xác minh điều hướng giữa các trang
chụp ảnh màn hình trong môi trường headless
kiểm tra local dev server đã expose qua tunnel từ agent sandbox
các kiểm tra UI lặp lại được, nơi việc inspect trước khi thao tác là quan trọng

Nó kém thuyết phục hơn với các tác vụ chỉ cần lấy nội dung trang tĩnh đơn giản hoặc những việc không cần duy trì phiên trình duyệt.

Câu hỏi thường gặp về skill remote-browser

remote-browser có thân thiện với người mới bắt đầu không?

Có, nếu bạn có thể nghĩ theo một vòng lặp đơn giản: mở, kiểm tra, thao tác, xác minh. Bạn không cần kiến thức Browser Automation nâng cao để bắt đầu. Rào cản lớn nhất với người mới thường là thiết lập môi trường, không phải độ phức tạp của lệnh.

Khi nào nên dùng remote-browser thay vì prompt duyệt web thông thường?

Hãy dùng remote-browser khi agent cần tương tác với các phần tử thật trên trang và duy trì trạng thái phiên làm việc. Prompt thông thường có thể đủ cho việc tóm tắt nội dung web công khai, nhưng yếu hơn rõ rệt với form, luồng có đăng nhập hoặc các tác vụ UI nhiều bước trong môi trường sandbox.

remote-browser có yêu cầu trình duyệt GUI cục bộ không?

Không. Mục đích của remote-browser skill là điều khiển trình duyệt từ một máy sandbox hoặc máy từ xa, nơi agent không có sẵn GUI trình duyệt thông thường.

remote-browser có làm việc với các trình duyệt sẵn có không?

Có. Các chế độ được tài liệu hóa bao gồm kết nối qua CDP bằng --connect hoặc --cdp-url, rất hữu ích nếu bạn đã có tiến trình trình duyệt hoặc endpoint trình duyệt được quản lý sẵn.

remote-browser chỉ dành cho website public thôi sao?

Không. Nó cũng có thể hỗ trợ các ứng dụng phát triển cục bộ nếu bạn expose chúng đúng cách, ví dụ qua một tunnel mà môi trường từ xa có thể truy cập. Yếu tố quan trọng nhất là phiên trình duyệt có chạm tới được hay không.

Các giới hạn chính của remote-browser là gì?

Chỉ riêng remote-browser install là chưa đủ nếu:

browser-use chưa được thiết lập đúng
ứng dụng đích không thể truy cập
tác vụ cần ngữ cảnh nghiệp vụ ẩn mà agent chưa từng được cung cấp
bạn yêu cầu quá nhiều quyền tự chủ mà không có bước xác minh trung gian

Skill này cung cấp quyền điều khiển trình duyệt, chứ không mang lại kiến thức “thần kỳ” về ứng dụng của bạn.

Khi nào remote-browser là lựa chọn không phù hợp?

Hãy bỏ qua remote-browser khi:

chỉ cần một lần HTTP fetch đơn giản là đủ
tác vụ không yêu cầu nhấp, nhập liệu, điều hướng hoặc chụp màn hình
bạn cần một test framework đầy đủ với assertion, fixture và orchestration cho bộ test lớn
môi trường của bạn cấm hoàn toàn việc chạy trình duyệt

Trong các trường hợp đó, một công cụ khác có thể đơn giản hơn hoặc vững chắc hơn.

Cách cải thiện skill remote-browser

Đóng khung tác vụ cho remote-browser tốt hơn

Yếu tố ảnh hưởng lớn nhất đến chất lượng đầu ra là chất lượng prompt. Prompt remote-browser tốt nên nêu rõ:

trang chính xác
hành trình người dùng chính xác
điều kiện dừng
bằng chứng cần thu thập
mọi hành động bị cấm

Điều này giúp giảm mơ hồ và ngăn agent tự ứng biến trong những trạng thái UI chưa được mô tả rõ.

Yêu cầu tương tác có nhận biết trạng thái, không nhấp “mù”

Một chỉ dẫn mạnh là:

“Inspect state before each major interaction and after each navigation.”

Chỉ một dòng này thôi cũng cải thiện độ tin cậy rõ rệt, vì agent sẽ bám lại vào cấu trúc trang thực tế thay vì dựa vào giả định từ các bước trước.

Cung cấp tiêu chí thành công mà agent có thể tự xác minh

Thay vì:

“Hãy đảm bảo nó hoạt động”

Hãy dùng:

“Confirm the dashboard loads, the profile name is visible, and a screenshot is saved after the update.”

Các trạng thái kết thúc có thể kiểm chứng luôn cho kết quả remote-browser usage tốt hơn so với những mục tiêu mang tính cảm tính.

Chia luồng nhiều bước thành các checkpoint

Với các tác vụ dài hơn, hãy yêu cầu agent báo lại theo các mốc như:

đã mở trang
đã hoàn thành đăng nhập
đã tới đúng biểu mẫu mục tiêu
đã xác minh kết quả gửi biểu mẫu

Cách checkpoint giúp bạn phát hiện sai hướng sớm hơn và thường nhanh hơn việc chạy lại cả một luồng dài chỉ vì một lỗi ẩn.

Dùng screenshot có chiến lược

Đừng yêu cầu chụp ảnh ở mọi cú nhấp. Hãy yêu cầu ở các thời điểm:

sau khi đăng nhập
trước khi gửi các biểu mẫu quan trọng
sau trạng thái thành công hoặc lỗi
ở kết quả cuối cùng

Như vậy bạn có đủ bằng chứng mà không làm workflow phình to không cần thiết.

Xử lý rõ các kiểu lỗi thường gặp

Các lỗi thường thấy của remote-browser bao gồm:

cố tương tác trước khi kiểm tra trạng thái hiện tại
dùng lại chỉ số phần tử cũ sau khi điều hướng
nhắm tới một ứng dụng localhost chưa được expose
prompt quá thiếu chi tiết, không có điều kiện thành công
giả định rằng đã có sẵn thông tin đăng nhập hoặc test data dù chưa từng được cung cấp

Nếu kết quả bị chập chờn, hãy kiểm tra các điểm này trước khi đổ lỗi cho skill.

Tăng tỷ lệ thành công lần chạy đầu bằng prompt hẹp hơn

Ở lần thử đầu tiên, đừng yêu cầu:

“Hãy test toàn bộ ứng dụng.”

Hãy yêu cầu:

“Open the login page, sign in, navigate to billing, and tell me whether the Upgrade button is present.”

Một lần chạy đầu hẹp hơn sẽ giúp xác nhận rất nhanh môi trường, quyền truy cập và khả năng điều khiển trình duyệt.

Lặp lại và tinh chỉnh sau đầu ra đầu tiên

Nếu lần chạy đầu chỉ thành công một phần, hãy tinh chỉnh bằng các chi tiết còn thiếu:

thêm đúng URL
làm rõ nút bấm hoặc đoạn văn bản nào là quan trọng
chỉ rõ có tiếp tục sau lỗi hay không
yêu cầu thêm một lần dump state ở bước bị lỗi

Thực hành tốt nhất trong remote-browser guide là siết dần theo vòng lặp, không phải đòi hỏi hoàn hảo ngay từ một lần.

Tăng độ tin cậy bằng cách khớp skill với môi trường của bạn

Nếu đội của bạn đã dùng cloud browser hoặc CDP endpoint, hãy nói rõ điều đó trong prompt và chọn đúng chế độ tương ứng. Nếu bạn dựa vào ứng dụng localhost được expose qua tunnel, hãy nêu rõ tunnel URL. Prompt càng khớp với môi trường thực thi thật, agent càng ít phải tự suy đoán.

Biết khi nào cần vượt ra ngoài remote-browser

Nếu bạn cần regression testing bền vững, assertion phức tạp hoặc orchestration cho bộ test lớn, hãy dùng remote-browser như một công cụ hỗ trợ thực thi có mục tiêu, không phải để thay thế toàn bộ browser test stack. Nó mạnh nhất khi đóng vai trò một agent skill cho các tác vụ trình duyệt có tính tương tác, đặc biệt trong môi trường sandbox.

Đánh giá & nhận xét

Chưa có đánh giá nào

Chia sẻ nhận xét của bạn

Đăng nhập để chấm điểm và để lại nhận xét cho skill này.

0/10000

Nhận xét mới nhất

Đang lưu...

Thêm skill trong danh mục này

playwright-interactive

bởi openai

playwright-interactive là một skill tự động hóa trình duyệt cho các phiên Playwright bền vững trong ứng dụng web cục bộ và Electron. Dùng nó để kiểm tra trạng thái giao diện, thử lại các tương tác, và chạy QA chức năng hoặc trực quan mà không cần khởi động lại chuỗi công cụ. Phù hợp khi bạn cần một hướng dẫn playwright-interactive thực tế cho gỡ lỗi lặp lại.

Browser Automation

Yêu thích 0GitHub 0

playwright-skill

bởi testdino-hq

playwright-skill là một hướng dẫn dành riêng cho Playwright, giúp tự động hóa trình duyệt một cách đáng tin cậy. Nó hỗ trợ nhóm viết, gỡ lỗi và mở rộng kiểm thử cho luồng E2E, kiểm tra API, kiểm thử component, visual regression, khả năng truy cập, xác thực, CI/CD và quá trình chuyển từ Cypress hoặc Selenium. Hãy dùng skill playwright-skill khi bạn cần các mẫu thực hành cụ thể thay vì lời khuyên kiểm thử chung chung.

Test Automation

Yêu thích 0GitHub 0

data-scraper-agent

bởi affaan-m

data-scraper-agent giúp xây dựng một pipeline dữ liệu công khai có thể lặp lại cho web scraping, làm giàu dữ liệu và lưu trữ. Skill này được thiết kế để theo dõi theo lịch các job, giá cả, tin tức, repo, thể thao và danh sách bằng GitHub Actions, với đầu ra đẩy tới Notion, Sheets hoặc Supabase. Phù hợp nhất cho việc theo dõi liên tục, không phải trích xuất một lần.

Web Scraping

Yêu thích 0GitHub 156.1k

playwright-best-practices

bởi currents-dev

playwright-best-practices là skill Playwright + TypeScript giúp viết test ổn định, giảm flake, tối ưu luồng auth, chọn giữa fixture và page object, đồng thời xử lý CI, popup, mobile, iframe, websocket và các kịch bản nhiều người dùng với hướng dẫn thực tế dựa trên repo.

Test Automation

Yêu thích 0GitHub 174

x-twitter-scraper

bởi Xquik-dev

Dùng x-twitter-scraper để lấy dữ liệu X (Twitter) và các tác vụ có xác nhận qua Xquik. Skill này hỗ trợ tìm kiếm tweet, tra cứu người dùng, trích xuất follower, tải media, monitors, webhooks, MCP và các tác vụ ghi. Phù hợp nhất cho nghiên cứu kiểu web scraping với API key, không phải với thông tin đăng nhập X.

Web Scraping

Yêu thích 0GitHub 71

composio

bởi ComposioHQ

Dùng composio để kết nối các workflow AI với ứng dụng bên ngoài qua CLI hoặc SDK. Skill composio này được xây dựng cho tự động hóa workflow, thao tác với ứng dụng, kết nối theo từng người dùng, khám phá toolkit, và một hướng dẫn thực tế về cài đặt cùng cách dùng trước khi bạn bắt đầu xây dựng.

Workflow Automation

Yêu thích 0GitHub 48

playwright-skill

bởi lackeyjb

playwright-skill là một skill tự động hóa trình duyệt để kiểm thử trang, điền biểu mẫu, kiểm tra liên kết, chụp ảnh màn hình, xác thực bố cục responsive và xử lý các luồng đăng nhập hoặc thanh toán. Skill này tự nhận diện dev server, dùng một executor phổ quát và giúp bạn chạy các tác vụ Playwright đáng tin cậy với ít thiết lập và phỏng đoán hơn.

Browser Automation

Yêu thích 0GitHub 0

browser-use

bởi browser-use

browser-use là skill tự động hóa trình duyệt dùng để mở trang, kiểm tra trạng thái, nhấp vào các phần tử theo chỉ mục, nhập liệu vào trường, chụp màn hình và tái sử dụng phiên trình duyệt liên tục. Phù hợp cho điền biểu mẫu ổn định, điều hướng và các quy trình cần đăng nhập bằng browser-use CLI.

Browser Automation

Yêu thích 0GitHub 84.9k

browser-testing-with-devtools

bởi addyosmani

browser-testing-with-devtools giúp tác nhân kiểm thử và gỡ lỗi hành vi thực tế trên trình duyệt thông qua Chrome DevTools MCP. Dùng kỹ năng này để kiểm tra DOM, thu thập lỗi console, phân tích yêu cầu mạng, đo hiệu năng và xác minh bản sửa lỗi ngay trên trình duyệt đang chạy.

Test Automation

Yêu thích 0GitHub 18.7k

baoyu-post-to-x

bởi JimLiu

baoyu-post-to-x tự động hóa việc đăng lên X bằng Chrome thật và CDP. Bạn có thể đăng văn bản, hình ảnh, video, bài trích dẫn và X Articles từ Markdown bằng các script bun, chế độ xem trước và quy trình chạy trực tiếp trên trình duyệt.

Social Media

Yêu thích 0GitHub 13.2k

use-my-browser

bởi xixu-me

use-my-browser là skill chiến lược tự động hóa trình duyệt, giúp chọn đúng lớp web cho từng tác vụ: công cụ web công khai, Chrome đang chạy, raw fetch hoặc Playwright cho các tình huống cần đăng nhập, nội dung động và thao tác qua DevTools.

Browser Automation

Yêu thích 0GitHub 6

playwright-cli

bởi VoltAgent

playwright-cli là một skill tự động hóa trình duyệt cho Playwright từ dòng lệnh. Nó hỗ trợ mở trang, kiểm tra phần tử, click qua các luồng thao tác, điền biểu mẫu, chụp ảnh màn hình, mô phỏng request và tạo mã test từ các tương tác thực tế. Phù hợp cho tự động hóa trình duyệt lặp lại và kiểm thử UI.

Browser Automation

Yêu thích 0GitHub 8.5k

windows-vm

bởi obra

Dùng skill windows-vm để tạo, quản lý và SSH vào một VM Windows 11 không giao diện trong Docker với tăng tốc KVM. Skill này phù hợp cho tự động hóa desktop, cài đặt ứng dụng Windows và các workflow tác tử lặp lại khi bạn cần một môi trường Windows thật mà không phải dùng RDP thủ công.

Desktop Automation

Yêu thích 0GitHub 323

notebooklm

bởi PleasePrompto

Dùng skill notebooklm để truy vấn các notebook Google NotebookLM từ Claude Code và nhận câu trả lời có nguồn, có trích dẫn rõ ràng. Skill này được xây dựng cho quy trình làm việc ưu tiên tài liệu, với tự động hóa trình duyệt, xác thực bền vững và quản lý notebook cho các tác vụ hướng dẫn NotebookLM cũng như tự động hóa quy trình.

Workflow Automation

Yêu thích 0GitHub 0

playwright

bởi openai

Dùng kỹ năng playwright để tự động hóa một trình duyệt thật ngay từ terminal với một script bọc và `playwright-cli`. Kỹ năng này hợp cho các tác vụ tự động hóa trình duyệt như điều hướng, điền biểu mẫu, chụp ảnh màn hình, tạo snapshot, trích xuất dữ liệu và gỡ lỗi luồng UI. Hãy kiểm tra `npx`, cài đặt kỹ năng, thiết lập `PWCLI`, rồi làm theo quy trình ưu tiên CLI.

Browser Automation

Yêu thích 0GitHub 0

canary-watch

bởi affaan-m

canary-watch là một skill giám sát sau triển khai để kiểm tra một URL đang hoạt động nhằm phát hiện hồi quy sau các lần phát hành, merge hoặc cập nhật phụ thuộc, trên môi trường staging hoặc production.

Monitoring

Yêu thích 0GitHub 156.1k