Skill Validation

Kham pha Agent Skill cho Skill Validation trong Xay dung skill va so sanh workflow, cong cu va tinh huong lien quan.

23 skills
A
springboot-verification

bởi affaan-m

springboot-verification là một vòng xác minh cho dự án Spring Boot, giúp bạn kiểm tra một thay đổi có an toàn trước khi tạo PR hoặc triển khai hay không. Hãy dùng hướng dẫn springboot-verification này cho xác thực build, phân tích tĩnh, kiểm thử kèm coverage, quét bảo mật và Skill Validation.

Skill Validation
Yêu thích 0GitHub 156.3k
A
santa-method

bởi affaan-m

santa-method là một quy trình xác minh đa tác tử dành cho những đầu ra phải chính xác trước khi phát hành. Nó dùng đánh giá độc lập để phát hiện điểm mù trong nội dung, các đầu ra gần với code, nội dung nhạy cảm về tuân thủ và các tác vụ tự động hóa quy trình. Hãy cài đặt skill santa-method khi bạn cần một vòng lặp generate, verify, converge có thể lặp lại một cách nhất quán.

Workflow Automation
Yêu thích 0GitHub 156.2k
A
rules-distill

bởi affaan-m

rules-distill là một skill bảo trì dành cho Skill Authors và người quản lý thư viện prompt. Skill này quét các skill đã cài đặt, chắt lọc những mẫu lặp lại thành các rule có thể tái sử dụng, và giúp bạn bổ sung, chỉnh sửa hoặc tạo file rule với ít phải đoán mò hơn so với một prompt review chung chung.

Skill Authoring
Yêu thích 0GitHub 156.2k
A
eval-harness

bởi affaan-m

Skill eval-harness là một khung đánh giá chính thức cho các phiên Claude Code và quy trình phát triển theo eval. Nó giúp bạn xác định tiêu chí đạt/không đạt, xây dựng các eval về năng lực và hồi quy, đồng thời đo độ tin cậy của agent trước khi triển khai các thay đổi về prompt hoặc workflow.

Model Evaluation
Yêu thích 0GitHub 156.1k
A
continuous-learning-v2

bởi affaan-m

continuous-learning-v2 biến các phiên Claude Code thành quá trình học theo phạm vi dự án với hooks, tác tử quan sát, chấm điểm độ tin cậy và cơ chế nâng các mẫu lặp lại thành skills, commands hoặc agents.

Skill Authoring
Yêu thích 0GitHub 156.1k
A
context-budget

bởi affaan-m

Skill context-budget giúp rà soát cách Claude Code sử dụng context trên agents, skills, rules và MCP servers. Công cụ này hỗ trợ phát hiện phần phình to, nội dung trùng lặp và các thành phần tốn chi phí cao, sau đó trả về danh sách hành động dọn dẹp theo mức độ ưu tiên. Hãy dùng hướng dẫn context-budget này để áp dụng context-budget hiệu quả và hỗ trợ Skill Testing trong các thiết lập lớn hơn.

Skill Testing
Yêu thích 0GitHub 156.1k
A
agent-sort

bởi affaan-m

agent-sort là một skill nhận biết ngữ cảnh repo, dùng để xây dựng kế hoạch cài đặt ECC dựa trên bằng chứng. Skill này giúp phân loại skills, commands, rules, hooks và extras vào hai nhóm DAILY và LIBRARY để bạn chỉ cài những gì dự án thực sự sử dụng. Hãy dùng skill agent-sort khi cần ra quyết định cài đặt, tìm hiểu cách dùng agent-sort, hoặc tham khảo hướng dẫn thực tế về agent-sort cho quy trình Skill Authoring.

Skill Authoring
Yêu thích 0GitHub 156k
O
writing-skills

bởi obra

writing-skills là hướng dẫn Skill Authoring để tạo, chỉnh sửa và kiểm định agent skill theo quy trình test-driven. Bạn sẽ nắm các tệp quan trọng, điều kiện cần có và các bước thực tế để xử lý pressure scenarios, baseline tests và lặp tinh gọn với SKILL.md.

Skill Authoring
Yêu thích 0GitHub 121.9k
O
verification-before-completion

bởi obra

verification-before-completion là skill kiểm tra cuối cùng, giúp chặn các tuyên bố hoàn tất khi chưa có căn cứ xác thực. Tìm hiểu khi nào nên dùng, cách cài từ obra/superpowers, và cách đối chiếu từng trạng thái với bằng chứng xác minh mới nhất.

Skill Validation
Yêu thích 0GitHub 121.9k
A
skill-creator

bởi anthropics

skill-creator là meta-skill soạn thảo skill, dùng để tạo skill mới, chỉnh sửa file SKILL.md hiện có, chạy eval, so sánh các biến thể và cải thiện mô tả trigger bằng script trong repo cùng công cụ review.

Skill Authoring
Yêu thích 2GitHub 105.1k
W
evaluation-methodology

bởi wshobson

Skill evaluation-methodology giải thích cách chấm điểm PluginEval cho Model Evaluation, bao gồm các lớp đánh giá, rubric, điểm tổng hợp, ngưỡng badge và hướng dẫn thực tế để đọc kết quả cũng như cải thiện các khía cạnh còn yếu.

Model Evaluation
Yêu thích 0GitHub 32.6k
T
testing-handbook-generator

bởi trailofbits

testing-handbook-generator là một meta-skill để tạo Claude Code skills từ Trail of Bits Testing Handbook (appsec.guide). Nó giúp tác giả skill, kỹ sư bảo mật và người bảo trì chuyển các phần của handbook thành các skill có thể tái sử dụng, với quy trình rõ ràng, kiểm soát phạm vi và khả năng tạo lặp lại. Hãy dùng skill testing-handbook-generator khi bạn cần một hướng dẫn testing-handbook-generator để viết skill từ handbook.

Skill Authoring
Yêu thích 0GitHub 5k
T
audit-prep-assistant

bởi trailofbits

audit-prep-assistant giúp chuẩn bị codebase cho Security Audit theo checklist của Trail of Bits. Skill này hỗ trợ xác định mục tiêu review, chạy phân tích tĩnh, tăng độ bao phủ kiểm thử, loại bỏ mã chết, ghi lại rủi ro và tạo các tài liệu hỗ trợ để bàn giao cho audit gọn gàng hơn.

Security Audit
Yêu thích 0GitHub 4.9k
S
skill-judge

bởi softaworks

skill-judge là skill dùng để review và chấm điểm khi thẩm định các gói AI skill và tệp SKILL.md. Công cụ này giúp tác giả và người bảo trì đánh giá độ mới của tri thức, độ rõ ràng khi kích hoạt, chất lượng quy trình và mức sẵn sàng để phát hành, kèm theo hướng dẫn cải thiện cụ thể, có thể hành động được.

Skill Validation
Yêu thích 0GitHub 1.3k
N
judge

bởi NeoLabHQ

Judge là skill đánh giá hai giai đoạn: trước hết khởi chạy một meta-judge, sau đó dùng một sub-agent judge để chấm bài với ngữ cảnh được cô lập, bằng chứng rõ ràng và tiêu chí minh bạch. Hãy dùng khi cần review chỉ trả kết quả cho code, bài viết, phân tích hoặc Skill Authoring, và khi bạn cần một hướng dẫn chấm có cơ sở thay vì chỉ là ý kiến cảm tính.

Skill Authoring
Yêu thích 0GitHub 982
N
do-and-judge

bởi NeoLabHQ

do-and-judge thực thi một tác vụ đơn lẻ với bước triển khai của sub-agent, một judge độc lập và cơ chế xác minh dựa trên retry cho đến khi đạt hoặc chạm số lần thử tối đa. Hãy dùng do-and-judge cho Workflow Automation khi bạn cần tiêu chí chấp nhận rõ ràng, thực thi tách biệt và ít phải đoán mò hơn so với một prompt chung chung.

Workflow Automation
Yêu thích 0GitHub 982
A
llm-patterns

bởi alinaqi

llm-patterns giúp bạn thiết kế logic ứng dụng ưu tiên AI, trong đó LLM đảm nhiệm suy luận, trích xuất và sinh nội dung, còn code xử lý xác thực, định tuyến và xử lý lỗi. Hãy dùng kỹ năng llm-patterns để có cấu trúc prompt rõ ràng hơn, quy trình LLM có thể kiểm thử, và hướng dẫn thực tế cho Skill Authoring.

Skill Authoring
Yêu thích 0GitHub 607
A
darwin-skill

bởi alchaincyf

darwin-skill giúp cải thiện các tệp SKILL.md bằng một vòng lặp lặp lại: đánh giá, chỉnh sửa, kiểm thử, rồi giữ lại hoặc hoàn tác thay đổi. Được xây dựng cho Skill Authoring, công cụ này kết hợp chấm điểm theo rubric với xác thực dựa trên prompt và hỗ trợ đầu ra kết quả trực quan từ các template và asset của repo.

Skill Authoring
Yêu thích 0GitHub 549
C
skill-creator

bởi ComposioHQ

skill-creator là một hướng dẫn Skill Authoring giúp bạn tạo mới hoặc cập nhật các Skills có thể tái sử dụng với phạm vi rõ ràng, quy trình làm việc, tài liệu tham chiếu và script. Hãy dùng skill-creator khi bạn cần hành vi nhất quán qua nhiều phiên làm việc, hỗ trợ đóng gói thực tế, và muốn giảm bớt việc phải tự đoán so với một prompt dùng một lần.

Skill Authoring
Yêu thích 0GitHub 48
N
reflect

bởi NeoLabHQ

reflect là một công cụ Skill Validation dùng để xem lại một phản hồi hoặc đầu ra trước đó. Công cụ này áp dụng phân loại độ phức tạp và bước xác minh để phát hiện lỗi bị bỏ sót, lập luận yếu và việc chấp thuận quá tự tin trước khi công việc được triển khai.

Skill Validation
Yêu thích 0GitHub 0
L
full-output-enforcement

bởi Leonxlnx

full-output-enforcement là một skill ràng buộc cho viết và thực thi, nhằm đảm bảo đầu ra đầy đủ, không bị lược bớt. Skill này cấm placeholder, phần trả về dang dở và việc bỏ qua các đoạn ở giữa, nên rất hữu ích cho tạo mã, tài liệu, di chuyển hệ thống và Skill Authoring khi tính đầy đủ là điều quan trọng.

Skill Authoring
Yêu thích 0GitHub 0
R
tutor

bởi RoundTable02

tutor là một skill học tập dựa trên quiz dành cho người dùng Obsidian StudyVault, phù hợp khi bạn cần đánh giá chẩn đoán, ôn theo từng khái niệm và theo dõi tiến độ. Skill này nhận diện ngôn ngữ, tìm vault, đọc dashboard và luyện các điểm yếu qua những phiên học có cấu trúc. Hãy dùng tutor khi bạn cần các lần kiểm tra học tập lặp lại, thay vì một chatbot tutor chung chung.

Skill Authoring
Yêu thích 0GitHub 0
D
skill-authoring-workflow

bởi deanpeters

skill-authoring-workflow giúp bạn biến ghi chú sơ sài, kết quả workshop hoặc prompt nháp thành `skills/<skill-name>/SKILL.md` đúng chuẩn và sẵn sàng cho repo. Dùng skill-authoring-workflow này để tạo mới hoặc cập nhật PM skills với ít phỏng đoán hơn, bám theo chuẩn của repo và kiểm tra trước khi commit.

Skill Authoring
Yêu thích 0GitHub 0