Model Evaluation

Model Evaluation taxonomy generated by the site skill importer.

5 Skills

agentic-engineering

von affaan-m

Lernen Sie die agentic-engineering Skill für eval-first Ausführung, Aufgabenzerlegung, Model-Routing und sicherere Workflow-Automation mit Regression-Checks.

Workflow Automation

Favoriten 0GitHub 156k

prompt-governance

von alirezarezvani

prompt-governance ist ein Claude Skill zur Verwaltung von Produktions-Prompts als versionierte, geprüfte und getestete Assets. Er hilft bei der Planung von Prompt-Registries, Regressionstests, A/B-Experimenten, Eval-Pipelines, Release-Freigaben und Rollback-Workflows für KI-Funktionen.

Prompt Governance

Favoriten 0GitHub 22.2k

senior-prompt-engineer

von alirezarezvani

senior-prompt-engineer ist ein modellunabhängiger Prompt-Writing-Skill für eval-getriebene Prompt-Optimierung, RAG-Qualitätsprüfungen, Validierung von Agent-Workflows sowie Token- und Kostenbudgetierung. Enthält Referenzen plus Python-Tools für Prompt-Analyse, RAG-Metriken und Agent-Orchestrierung.

Prompt Writing

Favoriten 0GitHub 22.1k

senior-data-scientist

von alirezarezvani

senior-data-scientist ist ein Claude Skill für A/B-Testdesign, kausale Analysen, Feature Engineering und die Bewertung tabellarischer ML-Modelle. Er hilft bei Stichprobengrößen, Metrikauswahl, Leakage-Prüfungen, SHAP-Reviews und MLflow-style Tracking; die Skripte sind Gerüstvorlagen, keine vollständigen Engines.

Machine Learning

Favoriten 0GitHub 22.1k

llm-patterns

von alinaqi

llm-patterns hilft dir, AI-first-Anwendungslogik zu entwerfen, bei der LLMs das Denken, Extrahieren und Generieren übernehmen, während Code für Validierung, Routing und Fehlerbehandlung zuständig ist. Nutze das llm-patterns Skill für eine klarere Prompt-Struktur, testbare LLM-Workflows und praxisnahe Hinweise zum Skill Authoring.

Skill Authoring

Favoriten 0GitHub 607