A
healthcare-eval-harness
作者 affaan-m
healthcare-eval-harness 是一個用於醫療應用部署的病人安全評估 harness。它能協助團隊在發布前驗證 CDSS 準確性、PHI 暴露、資料完整性、臨床工作流程行為,以及整合合規性。重大失敗會阻擋部署,因此它很適合用於 healthcare-eval-harness 的 Model Evaluation 與 CI 安全閘門。
模型評測
收藏 0GitHub 156.2k
作者 affaan-m
healthcare-eval-harness 是一個用於醫療應用部署的病人安全評估 harness。它能協助團隊在發布前驗證 CDSS 準確性、PHI 暴露、資料完整性、臨床工作流程行為,以及整合合規性。重大失敗會阻擋部署,因此它很適合用於 healthcare-eval-harness 的 Model Evaluation 與 CI 安全閘門。
作者 affaan-m
eval-harness 技能是一套正式的評估框架,適用於 Claude Code 工作階段與 eval-driven development。它能幫助你定義通過/失敗標準、建立能力與回歸評測,並在正式推出提示詞或工作流程變更前,衡量 agent 的可靠性。
作者 addyosmani
debugging-and-error-recovery 技能提供一套系統化的根因除錯流程,適用於失敗的測試、損壞的建置、執行階段錯誤與回歸問題。它強調保留證據、重現問題、依序診斷、以最小改動修正,並在往下進行前先驗證結果。
作者 AgriciDaniel
seo-drift 是一個 GitHub 技能,用來追蹤 SEO 關鍵頁面元素隨時間的變化、比對基準版本,並在部署、CMS 編輯或版型變更後及早發現回歸問題。當你需要清楚判斷是否有任何內容或設定被破壞時,可將 seo-drift 用於 SEO 內容、技術型頁面檢查,以及實際的 seo-drift 使用情境。