judge

bởi NeoLabHQ

Judge là skill đánh giá hai giai đoạn: trước hết khởi chạy một meta-judge, sau đó dùng một sub-agent judge để chấm bài với ngữ cảnh được cô lập, bằng chứng rõ ràng và tiêu chí minh bạch. Hãy dùng khi cần review chỉ trả kết quả cho code, bài viết, phân tích hoặc Skill Authoring, và khi bạn cần một hướng dẫn chấm có cơ sở thay vì chỉ là ý kiến cảm tính.

Stars982

Yêu thích0

Bình luận0

Đã thêm9 thg 5, 2026

Danh mụcSkill Authoring

Lệnh cài đặt

npx skills add NeoLabHQ/context-engineering-kit --skill judge

Điểm tuyển chọn

Skill này đạt 66/100, nghĩa là có thể đưa vào danh mục nhưng chỉ như một lựa chọn ở mức vừa phải, kèm lưu ý cho người dùng muốn một quy trình đánh giá có cấu trúc. Nó có đủ nội dung vận hành thực tế để đáng cài đặt, nhưng người dùng trong thư mục nên chuẩn bị tự diễn giải thêm vì repo không có script hỗ trợ, tài liệu tham chiếu hay lệnh cài đặt, và toàn bộ quy trình chủ yếu nằm trong một file `SKILL.md`.

66/100

Điểm mạnh

Mục đích và kích hoạt rất rõ: phần frontmatter nêu rằng nó khởi chạy một meta-judge rồi một sub-agent judge để đánh giá ngay trong cuộc hội thoại hiện tại.
Nội dung quy trình khá dày: phần thân skill dài, có nhiều heading và các giai đoạn được xác định, cho thấy đây không phải một prompt mẫu hời hợt.
Thiết kế thiên về bằng chứng: skill yêu cầu chấm điểm có cấu trúc và trích dẫn, giúp tác nhân đáng tin cậy hơn so với một prompt chung chung.

Điểm cần lưu ý

Không có file hỗ trợ hay lệnh cài đặt, nên việc áp dụng phụ thuộc vào việc đọc và tự triển khai quy trình trong `SKILL.md`.
Các chi tiết vận hành vẫn còn nằm rải trong phần diễn giải; người dùng trong thư mục có thể phải tự suy luận các bước thực thi cụ thể và cách xử lý tình huống biên.

Claude Claude Code Agents Evaluation Verification Reasoning Context Engineering

Tổng quan

Tổng quan về skill judge

judge làm gì

Skill judge khởi chạy một quy trình đánh giá hai giai đoạn: trước hết, một meta-judge xác định rubric phù hợp cho tác vụ, sau đó một sub-agent judge chấm điểm đầu ra với ngữ cảnh và bằng chứng được tách biệt. Đây là lựa chọn phù hợp nhất khi bạn cần một bản review có kỷ luật cho code, phân tích, viết lách hoặc đầu ra của agent, thay vì chỉ một nhận xét cảm tính.

Ai nên dùng judge

Hãy dùng skill judge khi bạn muốn một đánh giá chỉ trả về báo cáo, có tiêu chí rõ ràng, có trích dẫn và có phản hồi hành động được. Skill này đặc biệt hợp cho review Skill Authoring, review thay đổi trong repo, và bất kỳ tác vụ nào mà thiên kiến xác nhận hoặc phần dư của phiên làm việc có thể làm lệch phán đoán.

Vì sao judge khác biệt

Khác với một prompt chung chung chỉ yêu cầu “feedback”, judge xây dựng tiêu chí đánh giá trước khi bắt đầu chấm điểm. Điều đó khiến skill judge phù hợp hơn khi loại artifact chưa chắc chắn, khi bạn cần chấm điểm đa chiều, hoặc khi bản review phải đủ vững để giải trình với một người khác.

Cách dùng judge skill

Cài judge và kiểm tra file đầu vào

Cài bằng npx skills add NeoLabHQ/context-engineering-kit --skill judge. Hãy bắt đầu với plugins/sadd/skills/judge/SKILL.md, vì file này chứa workflow, input và các ràng buộc đánh giá quyết định cách judge hoạt động sau khi cài.

Đưa cho judge một mục tiêu đánh giá cụ thể

Skill này hoạt động tốt nhất khi bạn nêu rõ tác phẩm cần đánh giá và góc nhìn đánh giá. Một prompt mạnh sẽ giống như: Judge the last draft of the launch page for clarity, SEO fit, and factual accuracy. Prompt yếu như Review this sẽ để quá nhiều phần đoán định cho meta-judge.

Cung cấp đúng ngữ cảnh cho pipeline của judge

Hãy đưa vào artifact cần đánh giá, tiêu chí thành công, và mọi ràng buộc cứng như giọng điệu, đối tượng độc giả, ưu tiên của rubric, hoặc các thay đổi bị cấm. Nếu bạn dùng judge cho Skill Authoring, hãy nói rõ điều đó và nêu tên skill mục tiêu, vì rubric phải thay đổi để phản ánh độ rõ ràng khi cài đặt, khả năng được tìm thấy, và chất lượng hướng dẫn.

Đọc các file này trước

Khi cài đặt và điều chỉnh, hãy đọc SKILL.md trước, rồi đến bất kỳ file workflow hoặc policy nào mà repo có. Trong repo này, phần nội dung của skill chính là nguồn sự thật chính, nên đường đi nhanh nhất là xem cấu trúc prompt, các pha workflow, và yêu cầu về bằng chứng trước khi bạn sao chép mẫu này vào hệ thống của mình.

Câu hỏi thường gặp về judge skill

judge chỉ dành cho review code thôi à?

Không. Skill judge được thiết kế để đánh giá mọi đầu ra có thể quy về rubric: prompt, tài liệu, phân tích, đầu ra của agent, hoặc quyết định thiết kế. Điều cốt lõi là kết quả phải có thể được chấm dựa trên tiêu chí rõ ràng kèm bằng chứng.

Khi nào không nên dùng judge?

Không nên dùng judge khi bạn chỉ cần một phản ứng chủ quan nhanh, khi chưa có artifact hoàn chỉnh, hoặc khi tác vụ không thể đánh giá bằng bằng chứng. Trong những trường hợp đó, một prompt đơn giản thường nhanh hơn và ít mong manh hơn.

judge có phù hợp cho người mới không?

Có, nếu người dùng có thể nêu tên artifact và tiêu chí thành công. Người mới thường chỉ gặp khó khi yêu cầu một phán xét mà không có ngữ cảnh. Skill này giảm bớt vấn đề đó bằng cách bắt buộc có bước meta-judge, nhưng nó vẫn cần một mục tiêu thật rõ.

judge khác gì so với prompt thông thường?

Một prompt thông thường thường yêu cầu cùng một model vừa tự nghĩ ra tiêu chí vừa chấm kết quả trong một lượt. Skill judge tách hai vai trò này ra, nhờ vậy thường tăng tính nhất quán, giảm thiên kiến, và làm báo cáo cuối cùng dễ tin cậy hơn.

Cách cải thiện judge skill

Làm rõ mục tiêu đánh giá

Input tốt nhất cho judge sẽ nêu đúng artifact, đối tượng sử dụng mong muốn, và quyết định mà bạn đang muốn hỗ trợ. Ví dụ: Evaluate the new onboarding doc for first-time contributors, with emphasis on setup clarity and missing prerequisites. Cách này tốt hơn Check my doc vì rubric có thể bám sát rủi ro thực tế của người dùng.

Thêm các ràng buộc ảnh hưởng đến rubric

Nếu bạn quan tâm đến bằng chứng ở mức dòng, yêu cầu trích dẫn, hoặc một thang điểm cụ thể, hãy nói ngay từ đầu. Judge làm tốt hơn khi nó biết phải ưu tiên độ đúng, tính đầy đủ, độ rõ ràng về UX, hay mức độ tuân thủ policy, thay vì tự động dàn đều tất cả.

Lặp lại sau báo cáo đầu tiên

Hãy dùng báo cáo judge đầu tiên để siết chặt prompt tiếp theo: bổ sung ngữ cảnh còn thiếu, làm rõ các đánh đổi, và nêu bất kỳ phần nào bạn thấy bị chấm quá nhẹ. Với Skill Authoring, vòng lặp hữu ích nhất thường là yêu cầu judge đánh giá lại riêng độ rõ khi cài đặt, tính thực tế của cách dùng, và các trường hợp biên.

Theo dõi các chế độ lỗi thường gặp

Judge có thể kém hiệu quả khi nội dung nguồn quá mơ hồ, khi artifact chưa hoàn chỉnh, hoặc khi trọng tâm đánh giá bị nhồi quá nhiều mục tiêu. Nếu gặp tình huống đó, hãy tách tác vụ thành nhiều lượt hẹp hơn và chỉ đưa cho judge phần tài liệu cần thiết cho quyết định hiện tại.

Đánh giá & nhận xét

Chưa có đánh giá nào

Chia sẻ nhận xét của bạn

Đăng nhập để chấm điểm và để lại nhận xét cho skill này.

0/10000

Nhận xét mới nhất

Đang lưu...

Thêm skill trong danh mục này

create-colleague

bởi titanwings

create-colleague biến tài liệu đồng nghiệp, chat, email, ảnh chụp màn hình, dữ liệu Feishu và DingTalk thành một AI skill có thể chỉnh sửa, với đầu ra tách riêng phần công việc và chân dung, kèm các luồng cập nhật để tiếp tục tinh chỉnh theo thời gian.

Skill Authoring

Yêu thích 1GitHub 747

skill-creator

bởi anthropics

skill-creator là meta-skill soạn thảo skill, dùng để tạo skill mới, chỉnh sửa file SKILL.md hiện có, chạy eval, so sánh các biến thể và cải thiện mô tả trigger bằng script trong repo cùng công cụ review.

Skill Authoring

Yêu thích 2GitHub 105.1k

lean-ux-canvas

bởi deanpeters

lean-ux-canvas giúp các nhóm định hình vấn đề kinh doanh, làm rõ các giả định và xác định điều cần học tiếp theo bằng Lean UX Canvas v2. Hãy dùng nó để chuẩn bị workshop, thống nhất với các bên liên quan và khám phá sản phẩm ở giai đoạn đầu khi bạn cần một hướng dẫn lean-ux-canvas thực tế trước khi đi vào giải pháp.

Skill Authoring

Yêu thích 0GitHub 4.1k

documentation-lookup

bởi affaan-m

documentation-lookup giúp agent trả lời các câu hỏi về thư viện, framework và API dựa trên tài liệu hiện hành thay vì dựa vào trí nhớ. Đây là lựa chọn lý tưởng cho các tác vụ thiết lập, cấu hình, tra cứu tham chiếu và lấy ví dụ code khi cú pháp mới nhất là yếu tố quan trọng. Hãy dùng skill documentation-lookup cho Skill Docs khi yêu cầu phụ thuộc vào tài liệu trực tiếp và hướng dẫn chính xác theo phiên bản.

Skill Docs

Yêu thích 0GitHub 156.1k

mcp-builder

bởi anthropics

mcp-builder là hướng dẫn thực tiễn để lên kế hoạch, xây dựng và đánh giá MCP server cho API và dịch vụ bên ngoài. Nội dung giúp nhà phát triển chọn phạm vi tool, cách đặt tên, transport, mẫu triển khai với Python hoặc Node và quy trình đánh giá để agent dùng server ổn định, tin cậy.

MCP Server Development

Yêu thích 0GitHub 105k

user-story

bởi deanpeters

Skill user-story giúp bạn biến nhu cầu sản phẩm thành một user story duy nhất, sẵn sàng cho phát triển, với cách diễn đạt theo Mike Cohn và tiêu chí chấp nhận Gherkin. Hãy dùng nó để bàn giao rõ ràng hơn, ước lượng tốt hơn, và có một hướng dẫn user story chặt chẽ hơn cho các nhóm Technical Writing và sản phẩm.

Technical Writing

Yêu thích 0GitHub 4.1k

user-story-splitting

bởi deanpeters

Kỹ năng user-story-splitting giúp bạn tách các epic và user story lớn thành những story nhỏ hơn, có thể bàn giao độc lập, bằng các mẫu có cấu trúc. Hãy dùng nó cho ước lượng, sắp xếp thứ tự, giảm rủi ro và quy trình Skill Authoring khi một mục backlog quá rộng để xử lý trong một sprint.

Skill Authoring

Yêu thích 0GitHub 0

sanity-best-practices

bởi sanity-io

Skill sanity-best-practices giúp bạn chọn đúng các pattern của Sanity trước khi bắt tay vào xây dựng. Hãy dùng nó cho schema, GROQ, TypeGen, Visual Editing, Portable Text, bản địa hóa, migration, Functions, Blueprints và các tích hợp frontend như Next.js, Nuxt, Astro, Remix, SvelteKit, Angular, Hydrogen và App SDK.

Frontend Development

Yêu thích 0GitHub 0

provider-docs

bởi hashicorp

Skill provider-docs giúp bạn tạo mới, cập nhật và kiểm tra tài liệu Terraform Registry cho Terraform providers. Dùng cho công việc hướng dẫn provider-docs, provider-docs cho Technical Writing, và để giữ cho mô tả schema, các template tfplugindocs và đầu ra Registry luôn đồng bộ khi tài liệu thay đổi.

Technical Writing

Yêu thích 0GitHub 0

press-release

bởi deanpeters

Kỹ năng press-release giúp bạn soạn bản thông cáo báo chí kiểu Amazon Working Backwards trước khi xây dựng sản phẩm. Hãy dùng nó để làm rõ giá trị cho khách hàng, kiểm tra ý tưởng sản phẩm hoặc tính năng, và thống nhất các bên liên quan bằng một câu chuyện ngắn gọn, đặt khách hàng làm trung tâm. Hữu ích cho press-release trong Technical Writing và giai đoạn lập kế hoạch sản phẩm ban đầu.

Technical Writing

Yêu thích 0GitHub 4.1k

writing-skills

bởi obra

writing-skills là hướng dẫn Skill Authoring để tạo, chỉnh sửa và kiểm định agent skill theo quy trình test-driven. Bạn sẽ nắm các tệp quan trọng, điều kiện cần có và các bước thực tế để xử lý pressure scenarios, baseline tests và lặp tinh gọn với SKILL.md.

Skill Authoring

Yêu thích 0GitHub 121.9k

prd-generator

bởi ognjengt

prd-generator biến một ý tưởng sản phẩm thô thành một Product Requirements Document sẵn sàng cho AI. Skill này đặt câu hỏi làm rõ, bám theo một template cố định, và giúp founders, product leads, cùng các workflow Skill Authoring tạo ra spec rõ ràng hơn cho các công cụ AI coding ở bước sau. Dùng prd-generator khi bạn cần yêu cầu có cấu trúc, metrics, ràng buộc, và bối cảnh đủ chi tiết để triển khai.

Skill Authoring

Yêu thích 0GitHub 0

command-creator

bởi softaworks

command-creator giúp biến các quy trình Claude Code lặp lại thành slash commands có thể tái sử dụng. Bạn sẽ biết cách chọn pattern command phù hợp, viết hướng dẫn để agent có thể thực thi, quyết định dùng `.claude/commands/` hay `~/.claude/commands/`, và tận dụng bộ tài liệu đi kèm để tham khảo ví dụ cùng best practices.

Skill Authoring

Yêu thích 0GitHub 1.3k

altitude-horizon-framework

bởi deanpeters

altitude-horizon-framework là một skill ra quyết định dành cho giai đoạn chuyển từ PM lên Director. Hãy dùng nó để xác định các khoảng trống về độ cao nhìn nhận và tầm nhìn, làm rõ phạm vi và thời điểm, đồng thời áp dụng Cascading Context Map khi chiến lược còn mơ hồ. Skill này cũng cung cấp hướng dẫn thực tế về cài đặt, sử dụng và ví dụ để viết skill.

Skill Authoring

Yêu thích 0GitHub 4.1k

prompt-optimizer

bởi affaan-m

prompt-optimizer là một kỹ năng prompt-optimizer dùng để phân tích các prompt thô, xác định phần ngữ cảnh còn thiếu và viết lại thành prompt rõ ràng, có thể sao chép và dùng ngay. Kỹ năng này phù hợp nhất cho công việc hướng dẫn prompt-optimizer, rà soát prompt, và prompt-optimizer cho Prompt Writing, đặc biệt khi bạn cần cấu trúc tốt hơn cho Claude Code hoặc quy trình ECC. Kỹ năng này không thực thi tác vụ gốc.

Prompt Writing

Yêu thích 0GitHub 156.2k

continuous-learning-v2

bởi affaan-m

continuous-learning-v2 biến các phiên Claude Code thành quá trình học theo phạm vi dự án với hooks, tác tử quan sát, chấm điểm độ tin cậy và cơ chế nâng các mẫu lặp lại thành skills, commands hoặc agents.

Skill Authoring

Yêu thích 0GitHub 156.1k