Model Evaluation

보안 안에서 Model Evaluation 관련 Agent Skill을 살펴보고 비슷한 워크플로와 활용 사례를 비교하세요.

3 skills
W
evaluation-methodology

by wshobson

evaluation-methodology 스킬은 Model Evaluation을 위한 PluginEval 점수 체계를 설명합니다. 평가 레이어, 루브릭, 종합 점수 산정, 배지 기준점은 물론, 결과를 해석하고 취약한 평가 차원을 개선하는 실무적인 방법까지 다룹니다.

Model Evaluation
Favorites 0GitHub 32.6k
W
llm-evaluation

by wshobson

llm-evaluation 스킬을 사용하면 메트릭, 사람 검토, 벤치마킹, 회귀 점검을 바탕으로 LLM 앱, 프롬프트, RAG 시스템, 모델 변경에 대한 반복 가능한 평가 계획을 설계할 수 있습니다.

Model Evaluation
Favorites 0GitHub 32.6k
W
ml-pipeline-workflow

by wshobson

ml-pipeline-workflow는 데이터 준비, 학습, 검증, 배포, 모니터링까지 아우르는 엔드투엔드 MLOps 파이프라인을 설계할 때 참고하기 좋은 실무형 가이드입니다. 반복 가능한 워크플로 자동화를 위한 오케스트레이션 패턴도 함께 다룹니다.

Workflow Automation
Favorites 0GitHub 0