Model Evaluation

Model Evaluation taxonomy generated by the site skill importer.

5 件のスキル

agentic-engineering

作成者 affaan-m

agentic-engineeringスキルを使って、eval-firstの実行、タスク分解、モデルルーティング、回帰チェック付きのより安全なワークフロー自動化を学べます。

Workflow Automation

お気に入り 0GitHub 156k

prompt-governance

作成者 alirezarezvani

prompt-governance は、本番プロンプトをバージョン管理され、レビューされ、テスト済みの資産として扱うための Claude skill です。AI 機能における prompt registries、regression tests、A/B experiments、eval pipelines、release approvals、rollback workflows の設計・運用計画に活用できます。

Prompt Governance

お気に入り 0GitHub 22.2k

senior-prompt-engineer

作成者 alirezarezvani

senior-prompt-engineer は、モデルに依存しない Prompt Writing スキルです。評価に基づくプロンプト最適化、RAG の品質チェック、エージェントワークフローの検証、トークン／コスト見積もりに対応します。参考資料に加え、プロンプト分析、RAG メトリクス、エージェント orchestration 向けの Python ツールも含まれています。

Prompt Writing

お気に入り 0GitHub 22.1k

senior-data-scientist

作成者 alirezarezvani

senior-data-scientist は、A/B テスト設計、因果推論、特徴量エンジニアリング、表形式データの ML 評価を支援する Claude skill です。サンプルサイズの検討、指標選定、リークチェック、SHAP レビュー、MLflow 風のトラッキング設計に活用できます。ただし、含まれるスクリプトは完成済みエンジンではなく、足場となるテンプレートです。

Machine Learning

お気に入り 0GitHub 22.1k

llm-patterns

作成者 alinaqi

llm-patterns は、LLM が推論・抽出・生成を担い、コードが検証・ルーティング・エラー処理を担う、AIファーストなアプリケーションロジックの設計を支援します。より明確なプロンプト構造、テスト可能な LLM ワークフロー、Skill Authoring に役立つ実践的なガイダンスを得るために、この llm-patterns スキルを活用してください。

Skill Authoring

お気に入り 0GitHub 607