验证

网站技能导入器呈现的验证技能与工作流程。

11 个技能
A
terminal-ops

作者 affaan-m

terminal-ops 是一项面向终端工作的“先证据、后执行”仓库操作技能。你可以用它来运行命令、检查 git 状态、排查 CI 或构建问题,并在有明确验证结果的前提下做小范围修复。这个 terminal-ops 指南能帮助 Code Editing 和仓库操作减少猜测。

代码编辑
收藏 0GitHub 156.3k
A
springboot-verification

作者 affaan-m

springboot-verification 是面向 Spring Boot 项目的验证闭环,帮助你在提交 PR 或部署前确认改动是否安全。可用这份 springboot-verification 指南进行构建校验、静态分析、带覆盖率的测试、安全扫描以及 Skill Validation。

Skill 验证
收藏 0GitHub 156.3k
A
santa-method

作者 affaan-m

santa-method 是一套多智能体验证工作流,适用于那些在发布前必须确保正确无误的输出。它通过独立复核来发现内容、代码相关交付物、合规敏感文案以及工作流自动化任务中的盲点。若你需要一个可重复的“生成、验证、收敛”循环,就安装 santa-method 技能。

工作流自动化
收藏 0GitHub 156.2k
G
land-and-deploy

作者 garrytan

land-and-deploy 是一个工作流技能,用于合并已准备好的 PR、等待 CI 和部署完成,并通过 canary 检查验证生产环境健康状况。当你需要把“合并到上线”这段交接流程做得稳定可靠时,尤其适合使用这个 land-and-deploy 技能;对于已经使用 /ship 或类似发布步骤的团队,也很合适。

部署
收藏 0GitHub 91.8k
T
health

作者 tw93

health 会为 Codex、Claude Code、Pi、agent instructions、hooks/MCP、verifier surfaces 以及 AI 可维护性执行一次预算感知的 Agent Health 审计。使用 health 技能来检查为什么 agent 会忽略指令、漏掉验证,或逐渐偏向难以维护的行为。它尤其适合 Security Audit 工作流,但不适合调试代码或审查 PR。

安全审计
收藏 0GitHub 5.1k
T
ton-vulnerability-scanner

作者 trailofbits

ton-vulnerability-scanner 是一个面向 TON、专注于 FunC 编写的智能合约审计技能。它可帮助识别把整数当布尔值使用、伪造 Jetton 合约处理,以及在转发 TON 时遗漏 gas 检查等问题。适合在深入人工复核前,先做一轮快速的安全初筛。

安全审计
收藏 0GitHub 5k
N
launch-sub-agent

作者 NeoLabHQ

launch-sub-agent 可帮助你在多智能体系统中为边界明确的任务派发一个专注的子智能体。它会分析任务复杂度,选择合适的模型层级,支持按专长匹配智能体,并加入自我审查验证,以获得更可靠的结果。

多 Agent 系统
收藏 0GitHub 982
N
judge

作者 NeoLabHQ

Judge 是一个两阶段评估技能:先启动 meta-judge,再启动 judge 子代理,在隔离上下文、证据和明确标准下对作品打分。适合用于代码、写作、分析或 Skill Authoring 的仅报告式审查;当你需要一份站得住脚的 judge 指南,而不是随口给出的意见时,它尤其合适。

Skill 编写
收藏 0GitHub 982
N
plan-task

作者 NeoLabHQ

plan-task 会将草稿任务细化为可直接落地实施的计划,包含并行工作流、风险说明和验证关卡,适用于 Workflow Automation。

工作流自动化
收藏 0GitHub 982
N
implement-task

作者 NeoLabHQ

implement-task 是一款工作流自动化技能,可将任务规格转化为已实现的变更,并在关键步骤上通过自动化的 LLM-as-Judge 验证来把关。它帮助 agent 读取任务文件、按顺序执行工作、验证质量,并在已有部分进度的基础上继续推进,减少猜测。

工作流自动化
收藏 0GitHub 982
M
evaluation

作者 muratcankoylan

evaluation 技能可帮助你为非确定性系统设计并执行 agent 评估。适用于评估安装规划、评分标准、回归检查、质量门禁,以及 Skill Testing 场景下的评估;也适合 LLM-as-judge 工作流、多维度打分,以及需要可重复结果的实际评估使用。

Skill 测试
收藏 0GitHub 0
验证