A

agentic-engineering

作成者 affaan-m

agentic-engineeringスキルを使って、eval-firstの実行、タスク分解、モデルルーティング、回帰チェック付きのより安全なワークフロー自動化を学べます。

スター156k
お気に入り0
コメント0
追加日2026年4月15日
カテゴリーWorkflow Automation
インストールコマンド
npx skills add affaan-m/everything-claude-code --skill agentic-engineering
編集スコア

このスキルの評価は68/100です。エージェント主導のエンジニアリングワークフローを求めるユーザーには掲載価値がありますが、導入手順が十分に整ったタイプではありません。リポジトリには、汎用的なプロンプトよりも推測に頼らずエージェントを動かすための材料があり、特にeval-firstの実行やモデルルーティングの考え方は有用です。一方で、ディレクトリ利用者が期待すべきなのは、すぐに運用へ落とし込める完成度の高いツールというより、比較的ハイレベルな実践指針です。

68/100
強み
  • 用途と使いどころが明確です。説明文と冒頭ガイダンスで、AIエージェントが実装の大半を担うエンジニアリング作業をはっきり対象にしています。
  • 実務に寄せた運用モデルが示されています。eval-firstの進め方、15分単位でのタスク分解、タスクの複雑さに応じたモデルルーティングが整理されています。
  • エージェントの判断支援として有用です。完了条件、回帰チェック、セッション戦略、さらに不変条件やセキュリティ前提といったレビュー優先項目を重視しています.
注意点
  • install commandやスクリプト、補助ファイルは用意されておらず、導入はmarkdownのガイダンスを読み解くことが前提になります。
  • ワークフローはやや抽象的なままです。初回利用時の曖昧さを減らすための具体例、チェックリスト、リポジトリ内の参照リンクはありません。
概要

agentic-engineering スキルの概要

agentic-engineering は、品質・スコープ・コストのコントロールを失わずに、実装作業の大半を AI に任せたいチーム向けのワークフロースキルです。agentic-engineering skill は、何をどう出すかの方針はすでにあるものの、場当たり的な一発プロンプトではなく、分解・評価・モデル選定を再現可能な形で回したいエンジニアに最適です。

agentic-engineering にユーザーが求めるのは、ひらめきではありません。AI 支援開発を実運用に乗せるための、実践的な運用モデルです。中心となる仕事は、曖昧な開発タスクを検証可能な小単位に分け、各単位に適したモデル階層を選び、次へ進む前に回帰チェックで結果を確かめることです。

このスキルが他と違う理由

プロンプトだけに頼るやり方と違い、agentic-engineering は実行の дисциплине を最初から組み込んでいます。つまり、まず完了条件を定義し、作業をエージェントが扱える粒度まで分割し、eval で検証する、という流れです。そのため、気軽なコード下書きよりも、複数ステップのコーディング、リファクタリング、ワークフロー自動化に向いています。

このスキルに向いているケース

次のようなことを重視するなら、agentic-engineering を使う価値があります。

  • AI が書いたコードの手戻りを減らしたい
  • AI タスクをレビュー可能な小ささに保ちたい
  • 単純な作業は安いモデルに、難しい作業は強いモデルに振り分けたい
  • マージ後ではなく、早い段階で回帰を検出したい

向いていないケース

タスクが非常に小さい、純粋に見た目だけの変更、あるいはテストと lint ですでに完全に制約されている作業では、効果は薄くなります。短いコードスニペットや 1 行修正だけが必要なら、agentic-engineering の手順は少々大げさに感じるかもしれません。

agentic-engineering スキルの使い方

インストールしてソースを開く

agentic-engineering install では、スキルを追加したうえでスキルファイルを直接読みます。
npx skills add affaan-m/everything-claude-code --skill agentic-engineering

まずは skills/agentic-engineering/SKILL.md を開いてください。この repo には追加のルールフォルダや補助スクリプトがないため、価値の中心は大きなサポートツリーではなく、スキル本体にあります。

ざっくりした依頼を良いプロンプトに変える

このスキルは、入力の段階で次の要素が明確なときに最もよく機能します。

  • 目的
  • 完了の条件
  • 主なリスク
  • 壊れそうな箇所

弱い依頼の例は、「認証フローを改善して」です。

より強い依頼の例は、「ログイン成功、トークン更新、期限切れセッションの処理をそれぞれ個別にテスト可能な形へリファクタリングしてください。公開 API は維持し、トークン更新失敗の回帰チェックを追加し、低リスクな段階的変更を優先してください」です。

2 つ目のように書くと、agentic-engineering に必要な分解材料がそろい、eval を先に置いた実行がしやすくなります。

スキルに書かれたワークフローに従う

実務では、agentic-engineering usage の基本パターンは次の流れです。

  1. 完了条件を定義する
  2. タスクを 15 分単位に分割する
  3. 複雑さに応じてモデル階層を選ぶ
  4. コード変更前にベースラインチェックを走らせる
  5. 各単位を対象テストまたは eval で検証する
  6. 作業をまとめる前に回帰を再確認する

これは特に agentic-engineering for Workflow Automation で有効です。ワークフロー自動化は、複数ファイルにまたがりやすく、エッジケースも壊れやすく、見た目には正しく見えるのに下流のチェックで失敗することがあるためです。

最初に読むべき箇所

読む順番は次の通りです。

  • SKILL.md の運用モデル
  • Operating Principles と Eval-First Loop の各セクション
  • 15 分単位のルールがある Task Decomposition
  • AI 生成コードのための Model Routing と Review Focus
  • トークンやモデル費用を管理するなら Cost Discipline

agentic-engineering スキル FAQ

agentic-engineering は大規模プロジェクト専用ですか?

いいえ。隠れた依存関係がある作業で最も価値を発揮しますが、回帰リスクが高い中規模タスクでも役立ちます。変更が 1 回の素早い編集で検証できるなら、オーバーヘッドの方が大きいかもしれません。

通常のプロンプトとは何が違いますか?

通常のプロンプトは、モデルにコードの生成を求めます。agentic-engineering スキルは、成功条件を定義し、分解し、適切なモデルに振り分け、eval で検証するという、制御されたループで動くことをモデルに求めます。実装経路が不確かなときほど、このやり方の方が良い結果につながりやすくなります。

agentic-engineering は初心者向けですか?

はい。ただし、ユーザーがタスクを説明でき、良い完了条件を見分けられることが前提です。これはコーディングそのものの入門ではなく、AI によるコーディングをより安全で予測しやすくするためのプロセススキルです。

どんなときに使わないべきですか?

タスクが単純なとき、スピードが厳密さより重要なとき、成功を測る意味のある方法がないときは使わないでください。また、制御されたエンジニアリング出力ではなく、純粋な探索をしたい場合も、より弱い選択肢になります。

agentic-engineering スキルを改善する方法

入力をもっと鋭くする

品質を最も大きく上げるのは、タスクの切り出し方を良くすることです。受け入れ条件、制約、既知の失敗モードを最初から入れてください。たとえば、後方互換性が必要か、すでにテストがあるか、どのエッジケースが壊れやすいかを明記します。

実際のリスクに合う eval を使う

このスキルは、構文の正しさだけでなく、実際のユーザー影響を反映したチェックがあると最も強くなります。リスクが認証なら、更新と失敗経路をテストします。リスクが自動化なら、再試行、冪等性、状態遷移をテストします。これが agentic-engineering 改善の核心です。

1 回目の出力のあとに反復する

最初の出力を最終版だと思わないでください。結果が広すぎると感じたら、より狭い分解、別のモデル振り分け案、あるいはより厳しい回帰ゲートを依頼してください。良い agentic-engineering ワークフローは、プロンプトを大きくすることよりも、ループを締めることで生まれます。

評価とレビュー

まだ評価がありません
レビューを投稿
このスキルの評価やコメントを投稿するにはサインインしてください。
G
0/10000
新着レビュー
保存中...