benchmark

작성자 affaan-m

benchmark 스킬을 사용하면 성능 기준선을 측정하고, PR 전후의 성능 회귀를 사전에 감지하며, 페이지·API·빌드 전반에서 스택 대안을 비교해 Performance Optimization에 활용할 수 있습니다.

Stars156.1k

즐겨찾기0

추가됨2026년 4월 15일

카테고리Performance Optimization

설치 명령어

npx skills add affaan-m/everything-claude-code --skill benchmark

큐레이션 점수

이 스킬은 67/100점으로, 디렉터리에 등재할 만한 수준이지만 실제 실행 관점에서는 분명한 공백이 있습니다. 리포지토리는 벤치마킹을 언제 써야 하는지와 페이지, API, 빌드 성능 전반에서 무엇을 측정해야 하는지를 비교적 명확하게 보여 주므로, 에이전트가 적절한 시점에 이 스킬을 트리거할 가능성은 높습니다. 다만 이 스킬은 완전한 실행 레시피라기보다 측정 프레임워크에 가깝기 때문에, 실제로는 도구 선택, 실행 명령, 리포팅 워크플로는 사용자가 직접 마련해야 한다는 점을 염두에 두는 것이 좋습니다.

67/100

강점

트리거 조건이 뚜렷합니다. "When to Use" 섹션에서 PR 전후 점검, 기준선 수립, 성능 저하 원인 조사, 출시 준비 상태 확인, 스택 비교 같은 사용 시점을 분명하게 제시합니다.
벤치마킹 범위가 충실합니다. 페이지 성능, API, 빌드/개발 루프 성능에 대한 구체적인 지표를 정리하고 있으며, Core Web Vitals와 지연 시간 백분위수도 포함합니다.
에이전트 활용성이 좋습니다. 번호가 매겨진 측정 단계와 목표 임곗값이 있어, 일반적인 성능 평가 프롬프트보다 더 구조화된 실행이 가능합니다.

주의점

운영 측면의 명확성은 제한적입니다. 이 스킬은 browser MCP와 benchmarking 모드를 언급하지만, 테스트 실행에 필요한 install command, 지원 파일, 구체적인 명령 예시는 제공하지 않습니다.
신뢰도와 도입 근거는 다소 약합니다. 반복 가능한 워크플로 또는 예시 출력 결과를 보여 주는 스크립트, 참고 자료, 리소스, 보조 자산이 없습니다.

Claude Code Metrics Performance Testing API Browser Automation

개요

benchmark 스킬 개요

benchmark 스킬이 하는 일

benchmark 스킬은 즉흥적인 점검이 아니라 반복 가능한 워크플로로 성능 기준선을 측정하고, 회귀를 찾아내며, 대안을 비교할 수 있게 도와줍니다. 웹 페이지, API, 빌드 파이프라인, 변경 전/후 비교까지 아우르는 benchmark for Performance Optimization 용도로 설계되었습니다.

어떤 사람이 benchmark 스킬을 설치하면 좋은가

이 benchmark 스킬은 “이거 더 느려진 건가?” 또는 “이 PR이 실제로 성능을 개선했나?”처럼 근거가 필요한 엔지니어, 테크 리드, AI 보조 개발자에게 가장 잘 맞습니다. 출시 전 공통 측정 기준이 필요할 때, 사용자 불만이 접수된 직후, 또는 스택 변경을 검토하는 중일 때 특히 유용합니다.

일반적인 프롬프트보다 왜 유용한가

일반 프롬프트는 에이전트에게 “성능을 확인해줘” 정도만 지시할 수 있습니다. 반면 이 스킬은 더 구체적인 벤치마킹 프레임을 제공합니다. 예를 들어 Core Web Vitals와 페이지 용량 같은 페이지 지표, API 지연 시간 퍼센타일과 동시성 점검, 빌드/테스트 시간 같은 개발 루프 지표를 구조적으로 다룹니다. 이런 틀 덕분에 추측이 줄고, 결과를 시간 경과에 따라 비교하기도 쉬워집니다.

benchmark 스킬 사용 방법

설치 맥락과 먼저 읽어야 할 내용

benchmark install 기준으로는 skills/benchmark가 들어 있는 저장소에서 스킬을 추가한 뒤, 가장 먼저 SKILL.md를 여세요. 이 경우 스킬이 자체 완결형이라 실제로 쓸 수 있는 핵심 가이드는 대부분 그 파일에 들어 있습니다. 읽는 순서는 다음이 좋습니다:

SKILL.md
“When to Use” 섹션
현재 작업에 맞는 모드: page, API, build, 또는 before/after comparison

benchmark 스킬에 필요한 입력값

benchmark를 제대로 활용하려면 실제 대상과 성공 기준을 함께 줘야 합니다. 유용한 입력은 다음과 같습니다:

대상 URL 또는 API endpoint
환경: local, staging, preview, production
테스트할 변경 사항: branch, PR, commit, 또는 stack option
기대 목표: LCP, INP, p95 latency, build time, bundle size
테스트 제약: auth, seed data, region, device assumptions

약한 요청 예:
“Benchmark my app.”

더 강한 요청 예:
“Use the benchmark skill on these 3 staging URLs, collect LCP/CLS/INP, page weight, and request counts, then compare against production and flag regressions over 10%.”

막연한 목표를 강한 benchmark 프롬프트로 바꾸는 방법

benchmark 가이드를 쓸 때는 아래 같은 프롬프트 템플릿이 유용합니다:

Scope: page, API, build, or before/after
Targets: exact URLs, endpoints, commands, or branches
Metrics: what to measure and target thresholds
Comparison: baseline vs candidate
Output: summary table, regressions, likely causes, next actions

예시:
“Use the benchmark skill to compare this PR branch against main. For page performance, test /, /pricing, and /checkout on the preview deployment. Report LCP, FCP, CLS, INP, TTFB, total page weight, JS weight, and request count. Call out any regressions above 5% and suggest the top 3 fixes.”

출력 품질을 높이는 실전 workflow

신호 대 잡음비가 높은 benchmark usage 워크플로는 다음과 같습니다:

처음에는 모드 하나만 고릅니다.
안정적인 환경에서 baseline을 먼저 잡습니다.
같은 benchmark를 변경된 버전에 대해 다시 실행합니다.
비교 표와 회귀 요약을 요청합니다.
그다음에만 원인 진단과 최적화 아이디어를 요청합니다.

이 순서는 중요합니다. baseline을 건너뛰면 에이전트가 그럴듯하지만 신뢰도는 낮은 추천을 내놓기 쉽습니다. 결과 변동이 너무 크다면 대상 범위를 줄이고, 더 통제된 조건에서 반복 측정하세요.

benchmark 스킬 FAQ

이 benchmark 스킬은 페이지, API, 빌드 중 어디에 쓰나?

세 가지 모두에 쓸 수 있습니다. 이 스킬은 페이지 성능, API 성능, 빌드/개발 루프 성능을 명시적으로 다룹니다. 그래서 Lighthouse만 사용하는 워크플로보다 범위가 넓고, 프론트엔드·백엔드·툴링 전반에 성능 문제가 퍼져 있을 때 더 실무적입니다.

일반적인 성능 프롬프트 대신 언제 benchmark를 써야 하나?

반복 가능한 측정, 변경 전/후 비교, 회귀 탐지가 필요할 때는 benchmark를 쓰세요. 최적화 아이디어를 브레인스토밍하는 정도라면 일반 프롬프트도 괜찮지만, 실제 과제가 의견이 아니라 측정이라면 이 스킬이 더 적합합니다.

benchmark 스킬은 초보자도 쓰기 쉬운가?

그렇습니다. 다만 대상을 명확히 제공할 수 있어야 합니다. 모든 지표를 미리 알고 있을 필요는 없지만, 무엇을 어디서 벤치마킹하려는지는 알아야 합니다. 초보자는 한 페이지나 한 endpoint부터 시작하고, 첫 실행 결과를 이해한 뒤 범위를 넓힐 때 가장 큰 가치를 얻습니다.

언제는 잘 맞지 않나?

측정이 아니라 일반적인 성능 학습만 원한다면 이 benchmark 스킬은 건너뛰는 편이 낫습니다. 비교 가능한 실행을 만들기 어려울 정도로 환경이 불안정하거나, 접근 가능한 URL·호출 가능한 endpoint·실행 가능한 build command를 제공할 수 없는 경우에도 적합하지 않습니다.

benchmark 스킬 개선 방법

더 나은 benchmark 결과를 위해 입력을 더 명확하게 주기

가장 큰 개선 포인트는 입력 품질입니다. benchmark for Performance Optimization 목적이라면 다음을 구체적으로 적으세요:

정확한 대상
production 또는 staging 환경
baseline 버전과 candidate 버전
팀에서 중요하게 보는 임계값
필요한 auth/setup

“Benchmark our API”는 모호합니다.
“Benchmark POST /search and GET /products/:id on staging with 100 requests, 10 concurrency, and report p50/p95/p99 against our 300ms p95 SLA”는 바로 실행 가능한 요청입니다.

흔한 benchmark 실패 패턴 피하기

자주 발생하는 문제는 다음과 같습니다:

서로 다른 환경을 비교하는 경우
여러 변경 사항을 한 테스트에 섞는 경우
비현실적인 페이지나 endpoint를 사용하는 경우
측정보다 먼저 진단을 요청하는 경우
허용 가능한 회귀 임계값을 정의하지 않는 경우

이런 실패 패턴은 benchmark 결과를 시끄럽고 해석하기 어렵게 만듭니다. 먼저 측정 조건을 통제한 뒤, 그다음에 결과를 해석하세요.

개별 숫자보다 비교를 요청하기

단일 지표 스냅샷은 상대 변화만큼 유용하지 않습니다. benchmark 스킬의 출력을 더 실용적으로 만들려면 다음을 요청하세요:

baseline vs candidate 표
퍼센트 변화율
임계값 기준 pass/fail
상위 회귀 항목에 대해서만 의심 원인

이렇게 해야 에이전트가 숫자만 던지는 단계에서 벗어나, 실제 의사결정을 돕는 방향으로 움직입니다.

첫 benchmark 실행 뒤에는 반복적으로 다듬기

첫 번째 측정이 끝나면 범위를 더 좁히세요. 가장 느린 페이지만, 가장 나쁜 API percentile만, 또는 가장 무거운 build step만 다시 실행하도록 요청합니다. 그다음 “render-blocking assets에 집중해줘” 또는 “왜 p99가 p50보다 훨씬 나쁜지 조사해줘”처럼 타깃이 분명한 후속 요청을 하세요. 이런 반복 루프에서 benchmark guide의 가치가 가장 커집니다. 한 번의 넓은 측정을 실질적인 최적화 계획으로 바꿔주기 때문입니다.

평점 및 리뷰

아직 평점이 없습니다

리뷰 남기기

이 스킬의 평점과 리뷰를 남기려면 로그인하세요.

0/10000

최신 리뷰

저장 중...

이 카테고리의 다른 스킬

vercel-react-best-practices

작성자 vercel-labs

vercel-react-best-practices는 Vercel Engineering에서 만든 스킬로, AI 에이전트가 React와 Next.js 성능을 최적화하도록 워터폴, 번들 크기, 렌더링 관련 우선순위 규칙을 안내합니다.

Frontend Development

즐겨찾기 0GitHub 24k

performance-optimization

작성자 addyosmani

performance-optimization 스킬은 먼저 측정하고, 실제 병목을 찾아 수정한 뒤, 결과를 검증하도록 돕습니다. 성능 요구사항이 있거나 회귀가 의심될 때, 또는 Core Web Vitals, 로딩 시간, 상호작용 지연 개선이 필요할 때 사용하세요.

Performance Optimization

즐겨찾기 0GitHub 18.7k

supabase-postgres-best-practices

작성자 supabase

supabase-postgres-best-practices는 쿼리 튜닝, 인덱싱, 스키마 설계, RLS 성능, 락, 커넥션 관리에 초점을 맞춘 Supabase Postgres 최적화 스킬입니다.

Database Engineering

즐겨찾기 0GitHub 1.7k

wp-performance

작성자 WordPress

브라우저 UI 없이 백엔드에서 WordPress 성능을 조사하고 개선할 때 `wp-performance`를 사용하세요. 느린 프론트엔드 요청, 관리자 페이지, REST 라우트, WP-Cron을 측정 중심으로 진단할 수 있으며, WP-CLI `profile`/`doctor`, REST 헤더를 통한 Query Monitor, `Server-Timing`, 데이터베이스 쿼리, autoloaded options, 객체 캐싱, cron, 원격 HTTP 호출에 대한 가이드를 제공합니다.

Performance Optimization

즐겨찾기 0GitHub 1.4k

web-perf

작성자 cloudflare

web-perf는 Chrome DevTools MCP로 웹 성능을 분석합니다. Core Web Vitals, trace 기반 로드 문제, 렌더링 차단 리소스, 레이아웃 시프트, 캐싱 문제, 접근성 격차를 측정합니다. 최신 문서와 실시간 trace에 기반한 성능 최적화, 느린 페이지 디버깅, web-perf 가이드 워크플로에 이 스킬을 사용하세요.

Performance Optimization

즐겨찾기 0GitHub 1.3k

react-native-best-practices

작성자 callstackincubator

react-native-best-practices는 느린 시작, 프레임 드롭, 무거운 렌더링, 메모리 누수, 번들 비대화, 애니메이션 끊김을 다루는 실전 React Native 성능 최적화 가이드입니다. Hermes, 브리지 오버헤드, FlashList, 네이티브 모듈, 릴리스 회귀의 원인 분석과 근거 기반 해결책이 필요할 때 활용하세요.

Performance Optimization

즐겨찾기 0GitHub 1.3k

swift-nio

작성자 Joannis

swift-nio는 SwiftNIO 백엔드 개발을 위한 스킬로, 서버, 클라이언트, 파이프라인, 버퍼, 코덱, EventLoop 안전한 비동기 코드를 다룹니다. swift-nio 사용법 질문, 프로토콜 파싱, TCP/UDP 서비스, NIOAsyncChannel 통합, EventLoop에서 블로킹 작업을 디버깅할 때 활용하세요. 올바른 아키텍처와 구현을 돕는 실용적인 swift-nio 가이드입니다.

Backend Development

즐겨찾기 0GitHub 0

audit-website

작성자 squirrelscan

audit-website 스킬은 `squirrel` CLI를 사용해 SEO, 기술, 콘텐츠, 성능, 보안, 링크, 사이트 상태를 포함한 230개 이상의 규칙으로 웹사이트와 웹앱을 감사하고, 바로 활용할 수 있는 LLM용 실행 보고서를 반환합니다.

UX Audit

즐겨찾기 0GitHub 68

autoresearch

작성자 github

autoresearch는 측정 가능한 결과가 있는 코딩 작업을 위한 자율 실험 루프입니다. 개발자가 목표, 기준선, 지표, 범위를 정한 뒤, git 기반 체크포인트를 활용해 코드 변경, 테스트, 유지 또는 되돌리기 결정을 반복적으로 진행할 수 있도록 돕습니다.

Workflow Automation

즐겨찾기 0GitHub 0

godot-gdscript-patterns

작성자 wshobson

godot-gdscript-patterns는 Godot 4 사용자가 더 나은 씬 구조, signals, state machines, autoloads, async loading 패턴으로 GDScript를 생성하고 검토할 수 있도록 돕습니다. 게임플레이 시스템, UI 흐름, 유지보수하기 쉬운 프로젝트 코드에 검증된 Godot 아키텍처를 적용하려 할 때 유용합니다.

Frontend Development

즐겨찾기 0GitHub 32.5k

pytorch-patterns

작성자 affaan-m

pytorch-patterns는 디바이스에 구애받지 않는 패턴, 재현 가능한 실험, 명시적인 텐서 처리로 PyTorch 코드를 작성, 검토, 디버깅하도록 돕습니다. 더 깔끔한 학습 루프, 모델 리팩터링, 실용적인 PyTorch 가이드가 필요할 때 이 pytorch-patterns 스킬을 사용하세요.

Code Editing

즐겨찾기 0GitHub 156.2k

nextjs-turbopack

작성자 affaan-m

nextjs-turbopack 스킬은 Next.js 16+에서 Turbopack을 활용해 로컬 개발 속도, HMR, 번들러 선택 기준을 더 잘 잡도록 돕습니다. Frontend Development 워크플로에서 설치, 사용법, 그리고 webpack으로 되돌아가야 하는 시점을 실전형 nextjs-turbopack 가이드로 확인하세요.

Frontend Development

즐겨찾기 0GitHub 156.2k

jpa-patterns

작성자 affaan-m

jpa-patterns는 Spring Boot 백엔드 개발을 위한 실용적인 JPA/Hibernate 가이드입니다. 엔티티 설계, 연관관계, 쿼리 튜닝, 트랜잭션, 감사(auditing), 페이지네이션, 풀링까지 다루며, ORM 실수를 줄이고 영속성 성능을 높이는 데 도움을 줍니다.

Backend Development

즐겨찾기 0GitHub 156.2k

rust-async-patterns

작성자 wshobson

rust-async-patterns는 Tokio 기반 비동기 Rust 백엔드 개발을 위한 실전형 스킬로, task, channel, stream, timeout, cancellation, tracing, error handling 패턴을 폭넓게 다룹니다.

Backend Development

즐겨찾기 0GitHub 32.6k

go-concurrency-patterns

작성자 wshobson

go-concurrency-patterns는 worker pools, pipelines, channels, sync primitives, 그리고 context 기반 cancellation에 맞는 Go다운 동시성 패턴을 적용할 수 있도록 돕습니다. SKILL.md의 가이드를 바탕으로 더 안전한 백엔드 서비스를 설계하고, race conditions를 디버깅하며, graceful shutdown 동작을 개선하는 데 활용할 수 있습니다.

Backend Development

즐겨찾기 0GitHub 32.6k

async-python-patterns

작성자 wshobson

async-python-patterns는 I/O 중심 Python 시스템에서 안전한 asyncio 패턴을 선택할 때 참고하기 좋은 실용 가이드입니다. 도입 판단에 필요한 맥락을 빠르게 파악하고, 사용 방식을 검토하며, 이벤트 루프 블로킹을 피하고, 제한된 동시성, cancellation, sync-vs-async 트레이드오프를 고려한 async API, workers, scrapers, backend services 설계에 활용할 수 있습니다.

Backend Development

즐겨찾기 0GitHub 32.6k