Model Evaluation

Model Evaluation taxonomy generated by the site skill importer.

5 skills

agentic-engineering

par affaan-m

Découvrez le skill agentic-engineering pour une exécution orientée eval-first, la décomposition des tâches, l’orientation des modèles et une automatisation de workflow plus sûre avec des vérifications de régression.

Workflow Automation

Favoris 0GitHub 156k

prompt-governance

par alirezarezvani

prompt-governance est un skill Claude pour gérer les prompts de production comme des actifs versionnés, relus et testés. Il aide à structurer des registres de prompts, des tests de régression, des expérimentations A/B, des pipelines d’eval, des validations de release et des workflows de rollback pour les fonctionnalités d’IA.

Prompt Governance

Favoris 0GitHub 22.2k

senior-prompt-engineer

par alirezarezvani

senior-prompt-engineer est un skill de Prompt Writing indépendant du modèle, conçu pour l’optimisation de prompts pilotée par les évaluations, les contrôles qualité RAG, la validation de workflows d’agents et le suivi du budget tokens/coûts. Il inclut des références ainsi que des outils Python pour l’analyse de prompts, les métriques RAG et l’orchestration d’agents.

Prompt Writing

Favoris 0GitHub 22.1k

senior-data-scientist

par alirezarezvani

senior-data-scientist est une skill Claude pour la conception de tests A/B, le raisonnement causal, le feature engineering et l’évaluation de ML tabulaire. Utilisez-la pour cadrer le dimensionnement d’échantillon, le choix des métriques, les contrôles de fuite de données, la revue SHAP et le suivi de type MLflow ; les scripts fournis sont des gabarits, pas des moteurs complets.

Machine Learning

Favoris 0GitHub 22.1k

llm-patterns

par alinaqi

llm-patterns vous aide à concevoir une logique applicative orientée IA, où les LLM prennent en charge le raisonnement, l’extraction et la génération, tandis que le code gère la validation, l’orientation et le traitement des erreurs. Utilisez la skill llm-patterns pour structurer plus clairement vos prompts, créer des workflows LLM testables et bénéficier de conseils pratiques pour la création de skills.

Skill Authoring

Favoris 0GitHub 607