do-and-judge

작성자 NeoLabHQ

do-and-judge 스킬은 하위 에이전트의 구현 단계, 독립적인 판단자, 그리고 통과하거나 최대 재시도 횟수에 도달할 때까지 반복 검증을 통해 단일 작업을 실행합니다. 명확한 수용 기준, 분리된 실행, 그리고 일반적인 프롬프트보다 더 적은 추측이 필요할 때 워크플로 자동화에서 do-and-judge를 사용하세요.

Stars982

즐겨찾기0

추가됨2026년 5월 9일

카테고리Workflow Automation

설치 명령어

npx skills add NeoLabHQ/context-engineering-kit --skill do-and-judge

큐레이션 점수

이 스킬은 100점 만점에 78점으로, 구조화된 실행-검증 워크플로를 원하는 디렉터리 사용자에게 충분히 유력한 등록 후보입니다. 저장소에는 언제 사용해야 하는지와 어떻게 동작하는지 이해할 수 있을 만큼의 운영 정보가 담겨 있지만, 설치와 사용에 대한 망설임을 더 줄여 줄 보완 자료는 아직 다소 부족합니다.

78/100

강점

트리거와 워크플로가 분명합니다. 구현, 독립적 판단, 통과 시점 또는 최대 재시도까지의 반복이 필요한 단일 작업을 위한 용도임이 명확합니다.
에이전트 활용도가 높습니다. 메타-판단자와 판단 루프, 병렬 디스패치, 피드백 기반 재시도 패턴은 에이전트가 자기검증 편향을 줄이고 더 안정적으로 실행하는 데 도움이 됩니다.
운영 구조가 탄탄합니다. 유효한 frontmatter, 긴 본문, 많은 헤딩, 그리고 여러 워크플로/제약 신호가 실제 절차 문서임을 보여 주며, 단순한 자리표시자에 그치지 않습니다.

주의점

설치 명령, 지원 파일, 참조 자료가 제공되지 않아 사용자는 SKILL.md만으로 판단해야 합니다.
발췌문에는 강한 오케스트레이션 제약과 잘림 현상이 보이므로, 더 넓은 에이전트 구성에서는 이 스킬이 다소 경직되거나 적응이 어려울 수 있습니다.

Claude Code Claude Agents Evaluation Workflow

개요

do-and-judge 스킬 개요

do-and-judge가 하는 일

do-and-judge 스킬은 워크플로 자동화를 위한 단일 작업 실행 패턴입니다. 작업을 구현용 서브 에이전트에 넘기고, 별도의 심사 기준표를 만든 다음, 결과가 통과하거나 재시도 한도에 도달할 때까지 다시 시도합니다. 한 번에 생성하는 것보다 외부 검증의 품질이 더 중요한 작업에 적합합니다.

누가 사용해야 하나

do-and-judge는 리팩터링, 코드 수정, 구조화된 콘텐츠 변경처럼 명확한 완료 조건이 있는 범위 제한 작업을 에이전트가 끝내야 할 때 사용하면 좋습니다. 결과를 받아들이기 전에 자기 검토보다 독립적인 확인이 더 중요하다면 특히 잘 맞습니다.

무엇이 돋보이나

do-and-judge 스킬의 핵심 가치는 역할 분리입니다. 오케스트레이터가 작업을 직접 하지 않고, 구현 에이전트는 새 컨텍스트에서 작업하며, 심사자는 전용 명세를 기준으로 결과를 평가합니다. 이 구조는 사각지대를 줄여 주기 때문에, 속도보다 정확성이 더 중요할 때 do-and-judge 설치의 가치가 큽니다.

do-and-judge 스킬 사용 방법

do-and-judge 설치와 설정

do-and-judge 스킬을 skills 작업 공간에 설치한 뒤, 먼저 SKILL.md를 여세요. 운영 규칙과 제어 흐름이 모두 들어 있기 때문입니다. 저장소를 빠르게 훑을 때도 가장 먼저 SKILL.md를 읽는 것이 좋습니다. 여기에는 보조 스크립트나 지원 폴더가 없으므로, 스킬 파일이 곧 단일한 기준 문서입니다.

모호한 요청을 실행 가능한 입력으로 바꾸기

do-and-judge usage 패턴은 작업 범위가 좁고, 테스트 가능하며, 끝이 분명할 때 가장 잘 동작합니다. “이 모듈을 개선해줘”처럼 요청하기보다 다음을 분명히 주세요:

정확한 대상 파일 또는 컴포넌트
원하는 결과
바뀌면 안 되는 제약
통과/실패 조건 또는 기대 동작

강한 프롬프트 예시: UserService 클래스의 public 메서드 이름은 바꾸지 말고 dependency injection을 사용하도록 리팩터링해줘. 기존 테스트가 모두 계속 통과하는지 확인하고, constructor wiring이 명시적으로 드러나게 해줘.

권장 워크플로

실용적인 do-and-judge guide는 다음과 같습니다. 작업을 정의하고, 구현 에이전트가 독립적으로 일하게 두고, 심사 기준표를 만든 다음, 그 기준에 따라 결과를 확인하고, 구체적인 실패가 있을 때만 재시도합니다. 이 워크플로는 열린 탐색보다 통제된 실행이 목표인 do-and-judge for Workflow Automation에 맞춰 설계되었습니다.

저장소에서 무엇을 확인해야 하나

절차, 핵심 제약, 재시도 임계값은 SKILL.md에서 확인하세요. 특히 작업 범위, 컨텍스트 처리, 경고 신호 관련 섹션을 주의 깊게 봐야 합니다. 이 항목들이 오케스트레이터가 올바르게 동작하는지를 결정하기 때문입니다. 다른 스택에 맞게 스킬을 조정하려는 경우, 실제 작업에 적용하기 전에 그 규칙을 자신의 도구 체계에 맞춰 먼저 매핑하세요.

do-and-judge 스킬 FAQ

do-and-judge가 일반 프롬프트보다 더 나은가?

간단한 요청이라면 아닙니다. 일반 프롬프트가 더 빠릅니다. 하지만 작업을 구현하고 독립적으로 검증해야 하며, 첫 답변이 엣지 케이스를 놓치거나 요구사항에서 벗어날 가능성이 크다면 do-and-judge가 더 적합합니다.

이 스킬은 초보자도 쓰기 쉬운가?

네, 작업을 명확하게 설명할 수 있다면 그렇습니다. 가장 큰 학습 곡선은 문법이 아니라, 심사자가 추측 없이 결과를 평가할 수 있을 만큼 충분한 작업 맥락과 수용 기준을 제공하는 데 있습니다.

언제 do-and-judge를 쓰지 말아야 하나?

열린 탐색, 느슨한 아이디어 발상, 또는 성공 기준을 정의하기 어려운 작업에는 do-and-judge를 쓰지 마세요. 또한 오케스트레이터가 파일을 직접 편집하거나 도구를 실행하길 원할 때도 적합하지 않습니다. 이 스킬은 역할 분리와 검증을 중심으로 설계되어 있기 때문입니다.

Workflow Automation에서 어떻게 자리 잡는가?

더 큰 자동화 시스템 안에서 단일한 범위 제한 작업을 제어하는 레이어로 쓰는 것이 가장 잘 맞습니다. 이미 워크플로에 명시적 검사가 있다면, 이 스킬은 에이전트 루프를 구조화하는 데 가치를 더합니다. 반대로 수용 기준이 없다면 심사 단계가 너무 모호해서 도움이 되지 않습니다.

do-and-judge 스킬 개선 방법

심사 기준을 더 좋게 만들기

품질을 가장 크게 끌어올리는 요소는 평가 입력을 강화하는 일입니다. do-and-judge를 사용할 때는 “좋은 결과”가 무엇인지 관찰 가능한 기준으로 지정하세요. 필요한 동작, 금지된 변경, 커버리지 목표, 포맷 제약, 호환성 규칙처럼 구체적으로 적을수록 심사자가 약한 결과를 통과시킬 가능성이 줄어듭니다.

흔한 실패 모드 줄이기

가장 흔한 실패는 범위가 충분히 정의되지 않은 경우입니다. 작업이 너무 넓으면 구현 에이전트가 엉뚱한 것을 최적화할 수 있고, 심사자는 한참 뒤에야 문제를 잡아냅니다. 또 다른 실패 모드는 하위 호환성, 명명 규칙, 환경 제한 같은 숨은 제약입니다. 이런 내용은 재시도 루프가 알아서 추론하리라 기대하지 말고 처음부터 포함하세요.

첫 출력에서 반복을 개선하기

첫 실행이 기대에 못 미쳤다면 같은 작업을 다시 설명하는 데 그치지 마세요. 심사자가 지적한 실패를 그대로 반영하고, 수용 기준을 더 엄격하게 만들고, 모호한 표현을 제거하세요. do-and-judge usage에서는 두 번째 시도가 첫 번째보다 더 좁고, 더 테스트 가능해야 합니다.

다시 실행하기 전에 적합성부터 높이기

do-and-judge를 다른 저장소나 에이전트 스택에 맞게 조정하는 경우, 먼저 오케스트레이션 규칙을 자신의 도구 체계에 맞추세요. 독립적인 구현, 독립적인 심사, 제한된 재시도를 실제로 지원할 수 있는지 확인해야 합니다. 그렇지 않다면 억지로 밀어붙이기보다 패턴을 단순화하는 편이 낫습니다.

평점 및 리뷰

아직 평점이 없습니다

리뷰 남기기

이 스킬의 평점과 리뷰를 남기려면 로그인하세요.

0/10000

최신 리뷰

저장 중...

이 카테고리의 다른 스킬

playwright-interactive

작성자 openai

playwright-interactive는 로컬 웹 앱과 Electron 앱에서 지속되는 Playwright 세션을 다루는 브라우저 자동화 스킬입니다. UI 상태를 확인하고, 상호작용을 재시도하고, 도구 체인을 다시 시작하지 않고도 기능 QA와 시각적 QA를 수행할 때 유용합니다. 반복적인 디버깅을 위한 실용적인 playwright-interactive 가이드가 필요할 때 특히 적합합니다.

Browser Automation

즐겨찾기 0GitHub 0

huggingface-datasets

작성자 huggingface

Hugging Face Dataset Viewer API 작업에 이 huggingface-datasets 스킬을 사용해 데이터셋을 검증하고, split을 확인하며, 행을 미리 보고 페이지네이션하고, 텍스트를 검색하고, 필터를 적용하고, parquet 링크나 통계를 가져올 수 있습니다. 읽기 전용 데이터셋 탐색을 위한 실용적인 huggingface-datasets 가이드입니다.

Web Scraping

즐겨찾기 0GitHub 10.4k

iterative-retrieval

작성자 affaan-m

iterative-retrieval은 에이전트 작업에서 문맥 검색을 점진적으로 정교화하는 워크플로 패턴입니다. 서브에이전트가 문맥을 너무 많이도, 너무 적게도 받지 않도록 도와주며, iterative-retrieval 사용법, 설치 판단, Workflow Automation용 iterative-retrieval에 특히 유용합니다.

Workflow Automation

즐겨찾기 0GitHub 156.2k

data-scraper-agent

작성자 affaan-m

data-scraper-agent는 웹 스크래핑, 데이터 보강, 저장을 위한 반복 가능한 공개 데이터 파이프라인 구축을 돕습니다. GitHub Actions를 사용해 일정에 맞춰 작업, 가격, 뉴스, 저장소, 스포츠, 목록을 모니터링하도록 설계되었으며, 결과는 Notion, Sheets, 또는 Supabase로 보낼 수 있습니다. 일회성 추출보다는 지속적인 추적에 가장 적합합니다.

Web Scraping

즐겨찾기 0GitHub 156.1k

notion-meeting-intelligence

작성자 openai

notion-meeting-intelligence는 Notion의 문맥을 회의에 바로 쓸 수 있는 아젠다와 사전 읽기 자료로 바꿔 줍니다. 의사결정, 현황 점검, 계획 수립, 회고, 1:1 준비를 위해 Codex 리서치를 활용할 수 있습니다. 근거 있는 자료, 명확한 시간 배분, 참석자별 맞춤 결과물이 필요할 때 적합한 notion-meeting-intelligence 회의 준비 워크플로입니다.

Meeting Prep

즐겨찾기 0GitHub 18.6k

building-incident-response-playbook

작성자 mukul975

building-incident-response-playbook는 보안 팀이 단계별 페이즈, 의사결정 트리, 에스컬레이션 기준, RACI 책임 분담, SOAR 대응 구조를 갖춘 재사용 가능한 인시던트 대응 플레이북을 만들도록 돕습니다. 인시던트 대응 절차 문서화, 인시던트 분류 워크플로우, 감사에 유리한 운영 대응 계획을 염두에 두고 설계되었습니다.

Incident Triage

즐겨찾기 0GitHub 6.1k

building-patch-tuesday-response-process

작성자 mukul975

building-patch-tuesday-response-process는 팀이 Microsoft Patch Tuesday에 대응하는 반복 가능한 프로세스를 구축하도록 돕습니다. 공지사항을 분류하고, 위험도를 우선순위화하고, 패치를 테스트한 뒤, 배포를 승인하고, 준수 상태를 추적할 수 있습니다. 보안 운영, 취약점 관리, 그리고 프로젝트 관리용 building-patch-tuesday-response-process에 유용합니다.

Project Management

즐겨찾기 0GitHub 6.1k

secure-workflow-guide

작성자 trailofbits

secure-workflow-guide는 5단계 Solidity 보안 워크플로를 안내합니다. Slither 1차 점검, 기능별 체크, 시각적 검토, 보안 속성 메모, 수동 리뷰까지 포함됩니다. 배포나 릴리스 전에 반복 가능한 secure-workflow-guide 절차가 필요한 스마트 컨트랙트 팀, 감사자, 빌더를 위해 설계되었습니다.

Security Audit

즐겨찾기 0GitHub 4.9k

twitter-cli

작성자 public-clis

twitter-cli는 터미널 우선 방식으로 Twitter/X 타임라인, 북마크, 검색 결과, 프로필, 트윗 상세를 읽고, 인증 시 게시와 기타 쓰기 작업까지 지원하는 스킬입니다. 소셜 미디어 리서치, 계정 모니터링, CLI 기반의 가벼운 게시 작업에 적합합니다.

Social Media

즐겨찾기 0GitHub 2.3k

azure-ai-contentunderstanding-py

작성자 microsoft

azure-ai-contentunderstanding-py는 Azure AI Content Understanding용 Python 스킬입니다. 문서, 이미지, 오디오, 비디오에서 구조화된 콘텐츠를 추출해 RAG 워크플로와 자동화에 활용할 수 있습니다. 신뢰할 수 있는 멀티모달 추출, Azure 인증, 그리고 반복 가능한 파이프라인용 출력을 필요로 할 때 적합합니다.

RAG Workflows

즐겨찾기 0GitHub 2.2k

wp-performance

작성자 WordPress

브라우저 UI 없이 백엔드에서 WordPress 성능을 조사하고 개선할 때 `wp-performance`를 사용하세요. 느린 프론트엔드 요청, 관리자 페이지, REST 라우트, WP-Cron을 측정 중심으로 진단할 수 있으며, WP-CLI `profile`/`doctor`, REST 헤더를 통한 Query Monitor, `Server-Timing`, 데이터베이스 쿼리, autoloaded options, 객체 캐싱, cron, 원격 HTTP 호출에 대한 가이드를 제공합니다.

Performance Optimization

즐겨찾기 0GitHub 1.4k

wp-wpcli-and-ops

작성자 WordPress

wp-wpcli-and-ops 스킬은 WP-CLI에서 WordPress 운영 작업을 도와줍니다. 안전한 search-replace, db export/import, 플러그인 및 테마 작업, cron, 캐시 초기화, multisite 대상 지정, 그리고 백엔드 개발을 위한 반복 가능한 자동화까지 지원합니다.

Backend Development

즐겨찾기 0GitHub 1.4k

agents-sdk

작성자 cloudflare

agents-sdk는 상태를 유지하는 대화, 내구성 있는 실행, WebSocket 또는 스트리밍 채팅, MCP 통합, 예약 작업, 브라우저 자동화를 갖춘 Cloudflare Workers 에이전트를 만드는 데 도움이 됩니다. 이 agents-sdk 스킬은 기존 Workers 앱이든 새 앱이든 설치 여부 판단, 설정, 실전 활용에 초점을 맞추며, Cloudflare 런타임 제약에 맞을 때만 멀티 에이전트 시스템을 다룹니다.

Multi-Agent Systems

즐겨찾기 0GitHub 1.3k

reddit-ads

작성자 alinaqi

Reddit Ads API 워크플로를 위한 reddit-ads 스킬입니다. 캠페인 생성, 타게팅, 전환 추적, 광고 최적화까지 지원합니다. reddit-ads 가이드를 설치해 계정 계층, 예산, 잠재고객, API 기반 최적화를 더 적은 시행착오로 관리하세요.

Ad Optimization

즐겨찾기 0GitHub 611

existing-repo

작성자 alinaqi

existing-repo는 에이전트가 기존 코드베이스를 분석하고, 스택과 코딩 관례를 파악하며, 기존 패턴을 깨지 않으면서 가드레일을 추가하도록 돕습니다. Git 워크플로, 처음 접하는 저장소 작업, 유지보수, 그리고 무엇보다 수정 전에 이해가 필요한 설정 변경에 이 existing-repo 스킬을 사용하세요.

Git Workflows

즐겨찾기 0GitHub 607

composio

작성자 ComposioHQ

CLI 또는 SDK를 통해 AI 워크플로를 외부 앱과 연결할 때 composio를 사용하세요. 이 composio 스킬은 워크플로 자동화, 앱 액션, 사용자별 연결, 툴킷 탐색, 그리고 빌드를 시작하기 전에 설치와 사용법을 실용적으로 파악하는 데 맞춰져 있습니다.

Workflow Automation

즐겨찾기 0GitHub 48