Regression Testing

Regression Testing taxonomy generated by the site skill importer.

4 個技能

healthcare-eval-harness

作者 affaan-m

healthcare-eval-harness 是一個用於醫療應用部署的病人安全評估 harness。它能協助團隊在發布前驗證 CDSS 準確性、PHI 暴露、資料完整性、臨床工作流程行為，以及整合合規性。重大失敗會阻擋部署，因此它很適合用於 healthcare-eval-harness 的 Model Evaluation 與 CI 安全閘門。

模型評測

收藏 0GitHub 156.2k

eval-harness

作者 affaan-m

eval-harness 技能是一套正式的評估框架，適用於 Claude Code 工作階段與 eval-driven development。它能幫助你定義通過／失敗標準、建立能力與回歸評測，並在正式推出提示詞或工作流程變更前，衡量 agent 的可靠性。

模型評測

收藏 0GitHub 156.1k

debugging-and-error-recovery

作者 addyosmani

debugging-and-error-recovery 技能提供一套系統化的根因除錯流程，適用於失敗的測試、損壞的建置、執行階段錯誤與回歸問題。它強調保留證據、重現問題、依序診斷、以最小改動修正，並在往下進行前先驗證結果。

调试

收藏 0GitHub 18.7k

seo-drift

作者 AgriciDaniel

seo-drift 是一個 GitHub 技能，用來追蹤 SEO 關鍵頁面元素隨時間的變化、比對基準版本，並在部署、CMS 編輯或版型變更後及早發現回歸問題。當你需要清楚判斷是否有任何內容或設定被破壞時，可將 seo-drift 用於 SEO 內容、技術型頁面檢查，以及實際的 seo-drift 使用情境。

SEO 内容

收藏 0GitHub 6.2k