skill-comply

作者 affaan-m

skill-comply 是一款合规测试技能，用于在真实运行中检查 agent 是否遵循某个 skill、规则或 agent 定义。它会从 markdown 生成规范，运行三档 prompt 严格度，分类工具调用时间线，并基于证据输出合规率。适合用于 skill-comply 的合规审查。

Stars156.3k

收录时间2026年4月15日

分类合规审查

安装命令

npx skills add affaan-m/everything-claude-code --skill skill-comply

编辑评分

该技能得分 78/100，说明它很适合作为目录中的候选条目，适合想验证 agent 是否真的遵循了 skills、rules 和 agent definitions 的用户。仓库提供了清晰的工作流、明确的触发条件和配套脚本/测试，便于用户较有把握地判断安装价值，但也要预期一定的运行配置成本。

78/100

亮点

清楚描述了一个多步骤的合规工作流：规范生成、三级场景生成、trace 捕获、分类和报告。
触发条件和适用范围明确：SKILL.md 说明了何时启用，以及支持哪些目标（skills、rules、agent definitions）。
有真实实现证据：多个脚本、prompts、fixtures 和测试为文档中的工作流提供支撑。

注意点

SKILL.md 中没有安装命令，因此用户需要手动接入，且可能要查看脚本才能正确运行。
仓库注明 agent-definition 工作流验证尚未完全支持，因此相比标题所示的广泛范围，覆盖面仍有限。

Claude Code Claude 工作流测试 Automation Ai Quality Compliance

概览

skill-comply 技能概览

skill-comply 是一款合规测试技能，用来检查一个 agent 在真实运行中是否真的遵循了某个 skill、规则或 agent 定义。它适合需要证据而不是猜测的用户：例如验证工作流规则的维护者、测试新 skill 的作者，或者想确认编码 agent 在不同提示条件下是否仍然遵守 TDD、review 或流程约束的团队。

skill-comply 技能能做什么

skill-comply 会先根据一个 markdown 源文件生成预期行为规范，然后创建三个支持力度逐步降低的提示词，运行 agent，最后把实际工具调用时间线与规范进行比对。这样它就特别适合用于 Compliance Review：当你关心的不只是最终输出，还包括动作是否出现、以及动作顺序是否正确时，它会很有价值。

skill-comply 适合什么场景

当你需要验证一条规则在压力下是否还能被遵守时，就用 skill-comply：无论是支持性提示、普通提示，还是带竞争性的提示。它尤其适合依赖顺序的技能，比如“先测试，再实现”或“编辑前先读规则”这类要求。

skill-comply 的差异点在哪里

和那种笼统地问“它有没有遵守规则？”的普通提示不同，skill-comply 把检查流程真正落地了：它会提取步骤，用 LLM 对工具调用进行分类，并以确定性的方式评估顺序。它的价值在于 trace、timeline 和 compliance rate，这些信息能帮助你判断这个 skill 是否足够稳定，值得继续使用。

如何使用 skill-comply 技能

安装并启用 skill-comply

使用下面的命令安装 skill-comply 技能：

npx skills add affaan-m/everything-claude-code --skill skill-comply

然后把它运行到你想验证的 markdown 文件上。这个仓库本身的使用方式以 CLI 执行为中心，所以最好把它指向单个目标文件，并把输出当作合规报告来看，而不是把它当成一段文字摘要。

先阅读这些文件

要走 skill-comply install 和初始化路径，先从 skills/skill-comply/SKILL.md 看起，然后再检查 prompts/spec_generator.md、prompts/scenario_generator.md 和 prompts/classifier.md。这三个 prompt 展示了真实工作流：规范提取、场景生成和 trace 分类。如果你想理解实现层面的约束，再快速浏览 scripts/run.py、scripts/spec_generator.py、scripts/scenario_generator.py 和 scripts/classifier.py。

如何构造一个好的输入

一条高质量的 skill-comply usage prompt 应该是明确的合规目标，而不是模糊的政策描述。好的输入会写清楚文件和要验证的行为，例如：“检查 rules/common/testing.md 是否在编码任务中被遵守”或“衡量 agent 是否在这个 skill 里先写测试再实现”。像“这好吗？”这种弱输入，无法给工具足够的行为信号来评分。

提升效果的实用工作流

建议按这个顺序来：先选一条规则或一个 skill，生成规范，审查提取出的步骤，再运行三个场景等级。skill-comply for Compliance Review 的最佳用法，是把支持性、普通和竞争性三次运行并排比较，因为这样才能看出行为到底是不是稳健，还是只在 prompt 帮忙时才成立。

skill-comply 技能常见问题

skill-comply 只适用于编码技能吗？

不是。它最适合编码 agent 的工作流，但仓库明确支持 skill、规则和 agent definitions。如果你的目标是一个带有可观察动作的 markdown policy，skill-comply 依然很适合。

这和普通 prompt 测试有什么不同？

普通 prompt 测试只看回答看起来对不对。skill-comply 检查的是 agent 的动作是否匹配预期顺序，包括工具使用时机。这一点在合规关注的是流程而不只是输出时，尤其重要。

skill-comply 对新手友好吗？

如果你能确认被测试的文件，并描述你期望的行为，那它是友好的。更难的部分在于挑选一个有清晰可观察步骤的目标。对于规则本身很模糊、或者主要依赖人工判断的场景，它的价值就会低很多。

什么情况下不该用它？

如果目标没有可执行的顺序、没有有意义的工具调用，或者只有主观质量标准，就不要用 skill-comply。如果你需要的是超出单次 claude -p 运行和 trace 对比之外的完整生产可观测性，它也不是很合适。

如何改进 skill-comply 技能

提供更清晰的源材料

skill-comply 最适合的输入，是明确写出动作、顺序和例外情况的 markdown。若你的规则只写“优先测试”，而不是“实现前先写一个测试”，那么提取出来的规范就会更难评分，在 Compliance Review 里也没那么有用。

留意主要失败模式

最大的风险，是过度相信一个过于宽泛或过于狭窄的提取规范。另一个常见问题，是把提示支持度误认为真实合规：某个 skill 在支持性场景里看起来很好，但一旦提示变成普通或竞争性就失败了。要用 skill-comply usage 的结果检查稳健性，而不是只看一次绿色通过。

强化第一次运行的输入

提供目标路径、真实任务，以及复现被测行为所需的任何初始化命令。如果这个 skill 依赖文件、命令或环境假设，一定要显式写出来，这样生成的场景才会反映真实使用，而不是玩具示例。

从 trace 反馈回 spec 进行迭代

第一次运行后，先检查生成的 spec 和工具调用时间线，再去修改 prompt 或 skill 文本。如果某一步被漏掉了，要判断问题出在 skill 表述、场景设计，还是 detector 描述。skill-comply 最大的价值就在这个循环里：它把“它有没有遵守？”变成你可以直接改 source rule 的具体编辑建议。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

azure-ai-contentsafety-ts

作者 microsoft

azure-ai-contentsafety-ts 帮助你使用 Azure AI Content Safety 在 TypeScript 中分析文本和图像中的有害内容。可用于审核工作流、blocklist 以及针对仇恨、暴力、色情和自残的安全检查。内容还涵盖 Azure 端点与身份验证配置。

安全审计

收藏 0GitHub 2.3k

security-review

作者 affaan-m

使用 security-review 技能审查 auth、用户输入、secrets、API、支付、上传以及其他敏感流程。它提供一份实用的安全审查指南，包含清晰的通过/不通过检查、风险模式示例，以及一套聚焦的流程，帮助你在发布前发现常见问题。

安全审计

收藏 0GitHub 156.3k

django-security

作者 affaan-m

django-security 是一份面向 Django 应用加固的实用指南，涵盖认证、授权、CSRF、XSS、SQL 注入防护、安全 Cookie 和生产环境设置。它帮助开发者和审查者开展聚焦的 Security Audit，快速识别高风险配置，并在部署前落实具体修复。

安全审计

收藏 0GitHub 156.1k

codeql

作者 trailofbits

codeql 技能可帮助你在安全审计中更少遗漏地运行 CodeQL。它重点关注数据库质量、suite 选择、数据扩展和 SARIF 审查，让你在受支持的语言中更可靠地使用 codeql。适合在分析真实仓库时执行可重复的 codeql 指南步骤。

安全审计

收藏 0GitHub 5k

insecure-defaults

作者 trailofbits

insecure-defaults 技能可帮助识别 fail-open 配置模式——也就是软件在不安全设置下继续运行，而不是直接停止。适用于对生产代码、部署配置和密钥处理逻辑进行安全审计，帮助发现弱认证、硬编码密钥和过于宽松的默认配置。

安全审计

收藏 0GitHub 5k

algorand-vulnerability-scanner

作者 trailofbits

algorand-vulnerability-scanner 是一款面向 Algorand TEAL 和 PyTeal 的安全审计技能。它可帮助发现 11 类常见问题，包括 rekeying 攻击、费用校验缺口、字段检查缺失以及访问控制缺陷。建议在手动审计前，先用 algorand-vulnerability-scanner 技能做一轮实用的初筛复查。

安全审计

收藏 0GitHub 4.9k

security-ownership-map

作者 openai

使用 security-ownership-map 分析 git 历史中的安全所有权风险、巴士因子以及敏感代码归属。它可以将人员映射到文件，找出无人认领或归属不足的区域，并导出用于图分析的 CSV/JSON。最适合安全审计问题、CODEOWNERS 真实性核对，以及基于提交历史识别所有权集群。

安全审计

收藏 0GitHub 0

token-integration-analyzer

作者 trailofbits

token-integration-analyzer 是一项面向 token 实现与 token 集成的安全审查技能。它会检查 ERC20/ERC721 一致性、异常 token 模式、所有者权限、稀缺性，以及非标准 token 处理，适用于 Security Audit 工作流。使用 token-integration-analyzer 指南，可以减少猜测，更系统地评估兼容性风险。

安全审计

收藏 0GitHub 4.9k

auditing-kubernetes-cluster-rbac

作者 mukul975

auditing-kubernetes-cluster-rbac 用于审计 Kubernetes RBAC 中权限过宽的角色、高风险绑定、secret 访问以及权限提升路径。它面向 EKS、GKE、AKS 和自建集群的安全审计流程，适合结合 kubectl、rbac-tool、KubiScan 和 Kubeaudit 提供实用指导。

安全审计

收藏 0GitHub 0

auditing-gcp-iam-permissions

作者 mukul975

auditing-gcp-iam-permissions 可帮助审查 Google Cloud IAM 访问中的高风险绑定、基础角色、公开访问、服务账号暴露以及跨项目访问路径。这个访问控制审计技能面向证据驱动的审查，配合 gcloud、Cloud Asset、IAM Recommender 和 Policy Analyzer 使用。

访问控制

收藏 0GitHub 0

auditing-aws-s3-bucket-permissions

作者 mukul975

auditing-aws-s3-bucket-permissions 技能可帮助你审计 AWS S3 存储桶是否存在公开暴露、ACL 过度开放、bucket policy 过宽以及未启用加密等问题。它面向 Security Audit 工作流，支持可重复执行的最小权限审查，并提供围绕 AWS CLI 和 boto3 的指导，以及实用的安装与使用说明。

安全审计

收藏 0GitHub 0

accessibility-compliance

作者 wshobson

accessibility-compliance 技能可帮助团队依据实用的 WCAG 2.2、ARIA、键盘可访问性、屏幕阅读器和移动端无障碍指导，对 Web 或移动 UI 进行审计与改进。适合用于 UX 审计、组件修复以及可直接落地的整改建议。

UX 审计

收藏 0GitHub 32.6k

configuring-microsegmentation-for-zero-trust

作者 mukul975

configuring-microsegmentation-for-zero-trust 技能可帮助你为零信任环境设计并验证最小权限的工作负载间策略。使用本指南来划分应用、减少横向移动，并将观测到的流量转化为可执行的规则，供安全审计和运维使用。

安全审计

收藏 0GitHub 0

acquiring-disk-image-with-dd-and-dcfldd

作者 mukul975

acquiring-disk-image-with-dd-and-dcfldd 可帮助安全审计和取证用户使用 dd 或 dcfldd 创建可辩护的逐位磁盘镜像，并结合写保护、哈希校验和清晰的采集流程，支持事件响应与证据处理。

安全审计

收藏 0GitHub 0

perl-security

作者 affaan-m

perl-security 可帮助你审查 Perl 代码中的更安全输入处理、taint mode、shell 执行、DBI 占位符，以及 XSS、SQLi、CSRF 等 Web 安全问题。在进行安全审计、修复规划和安全开发时，当用户可控数据会流向敏感 sink，就适合使用这个 perl-security skill。

安全审计

收藏 0GitHub 156.2k

laravel-security

作者 affaan-m

laravel-security 技能是一份实用的 Laravel 安全检查清单，覆盖 authn/authz、验证、CSRF、mass assignment、文件上传、密钥、速率限制和安全部署。适合用于 Laravel 应用的审计、功能评审和加固工作。

安全审计

收藏 0GitHub 156.2k