Skill Validation

Kham pha Agent Skill cho Skill Validation trong Xay dung skill va so sanh workflow, cong cu va tinh huong lien quan.

31 skills

springboot-verification

bởi affaan-m

springboot-verification là một vòng xác minh cho dự án Spring Boot, giúp bạn kiểm tra một thay đổi có an toàn trước khi tạo PR hoặc triển khai hay không. Hãy dùng hướng dẫn springboot-verification này cho xác thực build, phân tích tĩnh, kiểm thử kèm coverage, quét bảo mật và Skill Validation.

Skill Validation

Yêu thích 0GitHub 156.3k

santa-method

bởi affaan-m

santa-method là một quy trình xác minh đa tác tử dành cho những đầu ra phải chính xác trước khi phát hành. Nó dùng đánh giá độc lập để phát hiện điểm mù trong nội dung, các đầu ra gần với code, nội dung nhạy cảm về tuân thủ và các tác vụ tự động hóa quy trình. Hãy cài đặt skill santa-method khi bạn cần một vòng lặp generate, verify, converge có thể lặp lại một cách nhất quán.

Workflow Automation

Yêu thích 0GitHub 156.2k

rules-distill

bởi affaan-m

rules-distill là một skill bảo trì dành cho Skill Authors và người quản lý thư viện prompt. Skill này quét các skill đã cài đặt, chắt lọc những mẫu lặp lại thành các rule có thể tái sử dụng, và giúp bạn bổ sung, chỉnh sửa hoặc tạo file rule với ít phải đoán mò hơn so với một prompt review chung chung.

Skill Authoring

Yêu thích 0GitHub 156.2k

eval-harness

bởi affaan-m

Skill eval-harness là một khung đánh giá chính thức cho các phiên Claude Code và quy trình phát triển theo eval. Nó giúp bạn xác định tiêu chí đạt/không đạt, xây dựng các eval về năng lực và hồi quy, đồng thời đo độ tin cậy của agent trước khi triển khai các thay đổi về prompt hoặc workflow.

Model Evaluation

Yêu thích 0GitHub 156.1k

continuous-learning-v2

bởi affaan-m

continuous-learning-v2 biến các phiên Claude Code thành quá trình học theo phạm vi dự án với hooks, tác tử quan sát, chấm điểm độ tin cậy và cơ chế nâng các mẫu lặp lại thành skills, commands hoặc agents.

Skill Authoring

Yêu thích 0GitHub 156.1k

context-budget

bởi affaan-m

Skill context-budget giúp rà soát cách Claude Code sử dụng context trên agents, skills, rules và MCP servers. Công cụ này hỗ trợ phát hiện phần phình to, nội dung trùng lặp và các thành phần tốn chi phí cao, sau đó trả về danh sách hành động dọn dẹp theo mức độ ưu tiên. Hãy dùng hướng dẫn context-budget này để áp dụng context-budget hiệu quả và hỗ trợ Skill Testing trong các thiết lập lớn hơn.

Skill Testing

Yêu thích 0GitHub 156.1k

agent-sort

bởi affaan-m

agent-sort là một skill nhận biết ngữ cảnh repo, dùng để xây dựng kế hoạch cài đặt ECC dựa trên bằng chứng. Skill này giúp phân loại skills, commands, rules, hooks và extras vào hai nhóm DAILY và LIBRARY để bạn chỉ cài những gì dự án thực sự sử dụng. Hãy dùng skill agent-sort khi cần ra quyết định cài đặt, tìm hiểu cách dùng agent-sort, hoặc tham khảo hướng dẫn thực tế về agent-sort cho quy trình Skill Authoring.

Skill Authoring

Yêu thích 0GitHub 156k

writing-skills

bởi obra

writing-skills là hướng dẫn Skill Authoring để tạo, chỉnh sửa và kiểm định agent skill theo quy trình test-driven. Bạn sẽ nắm các tệp quan trọng, điều kiện cần có và các bước thực tế để xử lý pressure scenarios, baseline tests và lặp tinh gọn với SKILL.md.

Skill Authoring

Yêu thích 0GitHub 121.9k

verification-before-completion

bởi obra

verification-before-completion là skill kiểm tra cuối cùng, giúp chặn các tuyên bố hoàn tất khi chưa có căn cứ xác thực. Tìm hiểu khi nào nên dùng, cách cài từ obra/superpowers, và cách đối chiếu từng trạng thái với bằng chứng xác minh mới nhất.

Skill Validation

Yêu thích 0GitHub 121.9k

skill-creator

bởi anthropics

skill-creator là meta-skill soạn thảo skill, dùng để tạo skill mới, chỉnh sửa file SKILL.md hiện có, chạy eval, so sánh các biến thể và cải thiện mô tả trigger bằng script trong repo cùng công cụ review.

Skill Authoring

Yêu thích 2GitHub 105.1k

evaluation-methodology

bởi wshobson

Skill evaluation-methodology giải thích cách chấm điểm PluginEval cho Model Evaluation, bao gồm các lớp đánh giá, rubric, điểm tổng hợp, ngưỡng badge và hướng dẫn thực tế để đọc kết quả cũng như cải thiện các khía cạnh còn yếu.

Model Evaluation

Yêu thích 0GitHub 32.6k

context-degradation

bởi muratcankoylan

context-degradation là một skill thực tiễn để chẩn đoán các lỗi ngữ cảnh trong những workflow dài, bao gồm lost-in-the-middle, poisoning, distraction, confusion và clash. Hãy dùng nó để xác định ngữ cảnh bị đứt ở đâu, quyết định cần đổi gì trước tiên, và áp dụng một hướng dẫn context-degradation có thể lặp lại cho Skill Authoring, vị trí đặt prompt, và gỡ lỗi agent trong môi trường production.

Skill Authoring

Yêu thích 0GitHub 15.6k

context-fundamentals

bởi muratcankoylan

context-fundamentals là một hướng dẫn thực hành về context engineering cho hệ thống AI agent. Nó giúp bạn quyết định phần nào nên nằm trong prompt, gỡ lỗi các vấn đề về context, và quản lý ngân sách token bằng cấu trúc context rõ ràng hơn. Hãy dùng skill context-fundamentals này khi bạn cần một hướng dẫn nền tảng, thực tế về context-fundamentals cho thiết kế agent và tối ưu prompt.

Context Engineering

Yêu thích 0GitHub 15.6k

skill-builder

bởi yusufkaraaslan

skill-builder giúp tác giả skill biến tài liệu, repo GitHub, PDF, video và codebase thành skill sẵn sàng cho AI với Skill Seekers. Công cụ này có phát hiện loại nguồn, quy trình được khuyến nghị và các bước dựa trên tool để soạn skill có thể lặp lại, thay vì chỉ prompt một lần rồi xong.

Skill Authoring

Yêu thích 0GitHub 13.5k

testing-handbook-generator

bởi trailofbits

testing-handbook-generator là một meta-skill để tạo Claude Code skills từ Trail of Bits Testing Handbook (appsec.guide). Nó giúp tác giả skill, kỹ sư bảo mật và người bảo trì chuyển các phần của handbook thành các skill có thể tái sử dụng, với quy trình rõ ràng, kiểm soát phạm vi và khả năng tạo lặp lại. Hãy dùng skill testing-handbook-generator khi bạn cần một hướng dẫn testing-handbook-generator để viết skill từ handbook.

Skill Authoring

Yêu thích 0GitHub 5k

audit-prep-assistant

bởi trailofbits

audit-prep-assistant giúp chuẩn bị codebase cho Security Audit theo checklist của Trail of Bits. Skill này hỗ trợ xác định mục tiêu review, chạy phân tích tĩnh, tăng độ bao phủ kiểm thử, loại bỏ mã chết, ghi lại rủi ro và tạo các tài liệu hỗ trợ để bàn giao cho audit gọn gàng hơn.

Security Audit

Yêu thích 0GitHub 4.9k

create-skill-test

bởi dotnet

create-skill-test tạo khung các file test eval.yaml cho agent skills trong dotnet/skills. Hãy dùng skill này để tạo test cho skill, xác định kịch bản, fixtures, assertions và rubrics, đồng thời giảm nguy cơ overfitting trong thiết kế đánh giá. Skill này không dùng để chạy test hiện có, gỡ lỗi lỗi validator, hay soạn file SKILL.md.

Skill Testing

Yêu thích 0GitHub 3k

create-skill

bởi dotnet

create-skill là trình tạo scaffold cho các skill agent mới theo phong cách dotnet/skills. Dùng nó để tạo một thư mục skill hợp lệ, sinh `SKILL.md` kèm frontmatter, và tuân theo các quy ước của kho cho Skill Scaffolding. Công cụ này phù hợp nhất cho việc tạo skill mới, không phải để chỉnh sửa skill đã có.

Skill Scaffolding

Yêu thích 0GitHub 3k

skill-optimizer

bởi mcollina

skill-optimizer giúp tác giả cải thiện AI skill về khả năng kích hoạt, độ rõ ràng và độ tin cậy khi chạy trên nhiều mô hình. Dùng cho Skill Authoring khi một skill đã được viết nhưng không được làm theo ổn định, trigger còn yếu, xuất hiện hồi quy, hoặc cần giảm chi phí ngữ cảnh. Nó hỗ trợ các vòng benchmark, cổng kiểm tra trước khi phát hành và tăng độ chính xác khi sử dụng.

Skill Authoring

Yêu thích 0GitHub 1.8k

skill-judge

bởi softaworks

skill-judge là skill dùng để review và chấm điểm khi thẩm định các gói AI skill và tệp SKILL.md. Công cụ này giúp tác giả và người bảo trì đánh giá độ mới của tri thức, độ rõ ràng khi kích hoạt, chất lượng quy trình và mức sẵn sàng để phát hành, kèm theo hướng dẫn cải thiện cụ thể, có thể hành động được.

Skill Validation

Yêu thích 0GitHub 1.3k

judge

bởi NeoLabHQ

Judge là skill đánh giá hai giai đoạn: trước hết khởi chạy một meta-judge, sau đó dùng một sub-agent judge để chấm bài với ngữ cảnh được cô lập, bằng chứng rõ ràng và tiêu chí minh bạch. Hãy dùng khi cần review chỉ trả kết quả cho code, bài viết, phân tích hoặc Skill Authoring, và khi bạn cần một hướng dẫn chấm có cơ sở thay vì chỉ là ý kiến cảm tính.

Skill Authoring

Yêu thích 0GitHub 982

do-and-judge

bởi NeoLabHQ

do-and-judge thực thi một tác vụ đơn lẻ với bước triển khai của sub-agent, một judge độc lập và cơ chế xác minh dựa trên retry cho đến khi đạt hoặc chạm số lần thử tối đa. Hãy dùng do-and-judge cho Workflow Automation khi bạn cần tiêu chí chấp nhận rõ ràng, thực thi tách biệt và ít phải đoán mò hơn so với một prompt chung chung.

Workflow Automation

Yêu thích 0GitHub 982

llm-patterns

bởi alinaqi

llm-patterns giúp bạn thiết kế logic ứng dụng ưu tiên AI, trong đó LLM đảm nhiệm suy luận, trích xuất và sinh nội dung, còn code xử lý xác thực, định tuyến và xử lý lỗi. Hãy dùng kỹ năng llm-patterns để có cấu trúc prompt rõ ràng hơn, quy trình LLM có thể kiểm thử, và hướng dẫn thực tế cho Skill Authoring.

Skill Authoring

Yêu thích 0GitHub 607

darwin-skill

bởi alchaincyf

darwin-skill giúp cải thiện các tệp SKILL.md bằng một vòng lặp lặp lại: đánh giá, chỉnh sửa, kiểm thử, rồi giữ lại hoặc hoàn tác thay đổi. Được xây dựng cho Skill Authoring, công cụ này kết hợp chấm điểm theo rubric với xác thực dựa trên prompt và hỗ trợ đầu ra kết quả trực quan từ các template và asset của repo.

Skill Authoring

Yêu thích 0GitHub 549