ab-test-setup

作者 coreyhaines31

ab-test-setup 可協助團隊把實驗構想整理成可執行的 Conversion A/B 測試計畫。你可以用它定義假設、判斷該採用 A/B 還是 A/B/n、估算樣本數與測試期間、設定主要指標與護欄指標，並運用 repo 範本撰寫結構化的測試 brief。

Stars17.3k

評論0

加入時間2026年3月29日

分類转化

安裝指令

npx skills add coreyhaines31/marketingskills --skill ab-test-setup

編輯評分

這個 skill 的評分為 78/100，對於想用結構化方式規劃 A/B 測試的使用者來說，是相當不錯的目錄收錄候選。repo 提供清楚的觸發語句、完整的流程指引與實用的參考資料，因此代理在這裡通常會比只靠通用 prompt 表現更好。不過使用者仍應把它視為偏向規劃／設計的 skill，而不是附帶工具支援的實作套件。

78/100

亮點

觸發性很強：描述中點出許多自然的使用者提問方式，例如「A/B test」、「split test」、「which version is better」以及「how long should I run this test」。
內容具實務價值：`SKILL.md` 涵蓋假設設計、測試限制與實驗原則，並附上樣本數與測試計畫範本的參考資料。
evals 提供可信度訊號：其中明確列出預期行為，例如確認產品／行銷情境、定義指標、處理樣本數問題，以及提醒不要過早偷看結果。

注意事項

實作層面的支援有限：沒有 scripts、安裝步驟或特定工具的執行說明，因此代理仍需自行判斷，才能把計畫落實到操作層面。
流程訊號比理想狀況更弱一些：結構化訊號顯示 workflow 0，因此部分逐步執行細節可能需要推定，而非文件中明確規定。

Marketing 分析测试转化率优化战略工作流 GTM GA4

總覽

ab-test-setup 技能總覽

ab-test-setup 是用來做什麼的

ab-test-setup 技能可協助你把一個模糊的實驗想法，整理成真正可執行、可落地的 Conversion 測試計畫。它特別適合行銷人員、成長團隊、產品行銷與 PM，用來判斷該測什麼、要怎麼設計測試，以及目前流量是否足以得出有意義的結論。

誰適合安裝這個技能

如果你經常需要協助處理以下情境，建議安裝 ab-test-setup：

標題或 CTA 實驗
landing page 與 signup flow 測試
訊息或 offer 變動的 variant 規劃
sample size、測試期間與 significance 相關問題
判斷某個想法到底適不適合做 A/B test

如果你的團隊已經不缺點子，但缺少一套可重複使用的實驗 brief，這個技能尤其有價值。

這個技能真正解決的工作

多數失敗的測試，問題不在於 variant 點子不好，而是在 setup 太弱：沒有清楚的假設、一次改太多東西、沒有 baseline、沒有可偵測效果目標，或缺乏 guardrails。ab-test-setup skill 的設計目的，就是在上線前強迫補齊這些原本容易被忽略的基本功。

這個技能和一般 prompt 有什麼不同

一般 prompt 常常只會幫你想測試點子；ab-test-setup 則會把重點推向更有效、也更合理的實驗規劃：

從 hypothesis 出發，而不是只說「試兩個版本」
會要求 baseline conversion rate 與 traffic
會納入 sample size 與 test duration 的考量
能區分 A/B、A/B/n 與 multivariate 的選擇
會提醒不要偷看結果，也會警告 underpowered tests
會指向 repo 內的 templates 與 sample-size 參考資料

最適合與不適合的使用情境

最適合：

你已經知道要測哪一頁、哪一群受眾、以及目標是什麼
你需要快速產出一份結構完整的測試 brief
你想為 Conversion 實驗建立更好的 prompting 流程

不適合：

你目前首先需要的是 instrumentation 或 event tracking 設計
你想先拿到頁面改寫點子，還不是測試計畫
你的流量非常低，需要的是正式測試以外的替代方案

如何使用 ab-test-setup 技能

在你的 skills 環境安裝 ab-test-setup

請依照目錄基準頁提供的 repository 安裝方式：

npx skills add https://github.com/coreyhaines31/marketingskills --skill ab-test-setup

安裝後，先打開以下檔案：

skills/ab-test-setup/SKILL.md
skills/ab-test-setup/references/sample-size-guide.md
skills/ab-test-setup/references/test-templates.md
skills/ab-test-setup/evals/evals.json

這些檔案的重要性高於快速瀏覽，因為它們直接展示了這個技能預期的決策流程、輸出格式，以及品質門檻。

先讀這幾個檔案

如果你在使用 ab-test-setup 前只能先讀三個檔案，請優先看：

SKILL.md：了解觸發條件與規劃邏輯
references/sample-size-guide.md：用來判斷可行性與測試時長
references/test-templates.md：看模型應該輸出的最終結構

接著再查看 evals/evals.json，了解這個技能在真實 prompt 情境下，什麼樣的回答才算好答案。

ab-test-setup 需要哪些輸入

只要你提供以下資訊，這個技能的表現會明顯更好：

要測試的頁面或功能
主要 conversion event
目前的 baseline conversion rate
每月或每週流量
預計進行的改動
目標 audience segment
工具或實作限制
時程或 launch window
對 false positives 的風險容忍度

如果沒有 baseline 與 traffic，ab-test-setup usage 就會變得比較泛，對實際決策的幫助也會下降。

如果有 product marketing context，先提供

repo 明確要求這個技能優先查看 .agents/product-marketing-context.md 或 .claude/product-marketing-context.md。這點很重要，因為好的實驗設計很依賴：

audience
positioning
核心主張
現行 messaging strategy
funnel stage

如果你的環境中有這個檔案，請確保模型在重複追問探索問題之前，先把它讀完。

把粗略想法改寫成更強的 ab-test-setup prompt

弱的 prompt：

We want to test our homepage headline. What should we do?

更好的 prompt：

Use ab-test-setup to plan an A/B test for our homepage headline. Current headline: "The All-in-One Project Management Tool." Proposed direction: more benefit-focused messaging for SaaS team leads. Baseline signup rate is 3.2%. We get about 15,000 homepage visitors per month. Primary goal is signup rate. We can implement one variant only, 50/50 traffic split, in our existing testing tool. Please create a hypothesis, recommend test type, estimate sample needs and likely duration, define primary/secondary/guardrail metrics, and flag risks like peeking or low power.

第二種寫法提供了足夠的情境，讓技能能產出一份計畫，而不是只給泛泛的腦力激盪建議。

直接要求你真正需要的輸出格式

參考檔裡已經有可重複使用的 templates，因此你可以直接要求以下格式之一：

供審核用的 experiment brief
launch checklist
test plan template
stakeholder update
post-test readout shell

實用 prompt：

Use the test plan template format from references/test-templates.md and fill only fields we can support with the data provided. Mark missing assumptions clearly.

這樣可以減少後續整理工作，也能更早暴露缺少的輸入資訊。

用這個技能做決策，不只是拿來生點子

最實用的 ab-test-setup guide 使用流程是：

描述預計進行的改動
說清楚商業目標
提供 baseline 與 traffic
詢問這個測試是否可行
再要求具體 metric 與執行條件
最後才請它提出 variant 建議

這個順序很重要，因為它能避免團隊在無法達到足夠 sample size 的測試上投入過多時間。

了解它強制執行的核心規劃原則

從原始內容來看，這個技能特別強調：

先從清楚的 hypothesis 開始
一次只測一件事
定義 primary、secondary 與 guardrail metrics
預估 sample size 與最低測試期間
不要因為前期雜訊造成的短暫領先就提早收測

如果你的組織常常在缺乏這些控制條件下就直接上「快速測試」，這個技能就能補上真正的價值。

如何把 ab-test-setup 用在 Conversion 工作上

在使用 ab-test-setup for Conversion 時，除了 variant 想法，也要把商業影響一併說清楚。好的輸入包括：

目前 conversion 的瓶頸
為什麼現有頁面可能表現不佳
預期改動的作用機制
最低值得採取行動的 lift
哪些 segments 不能變差

例如：

We think our pricing page CTA underperforms because it asks for commitment too early. Plan an A/B test comparing "Start Free Trial" vs "See Plans First." Baseline click-through is 6.8%, downstream trial-start rate is 2.1%, and pricing page traffic is 40,000 sessions/month. We care most about completed trial starts, not just button clicks. Include guardrails so a CTR lift does not hide lower-quality signups.

這樣的 prompt，會比單純要求測按鈕顏色，更能引導出正確的 metric 選擇。

什麼時候這個技能會反駁你的想法

當 ab-test-setup 說出以下這些話時，通常正是它最有幫助的時候：

這個情況不應該做 multivariate
你的流量不足以支撐四個 variants
你的 MDE 設得不切實際地小
你的 primary metric 和實際測試改動距離太遠
你把太多改動混在一起，無法做因果學習

這種反駁不是阻力，而是這個技能本身的價值所在。

repo 支撐的常見使用情境

根據 skill 內容與 evals，適合的用法包括：

homepage headline A/B tests
pricing 或 signup 頁面的 CTA variant 測試
判斷 A/B/n 是否現實可行
根據 traffic 與 baseline 規劃測試時間
為實驗 rollout 建立結構化文件

evals 也顯示，當使用者隨口問出像「should we test 4 CTA colors?」這種需求時，這個技能應該能把對話引導回更紮實的實驗設計。

ab-test-setup 技能常見問題

ab-test-setup 適合初學者嗎？

適合，但前提是你已經理解自己的頁面與目標。這個技能能補上初學者最常漏掉的結構：hypothesis、sample size 思維、metrics 與 duration。不過，如果你需要的是從零開始的統計學入門，它就不是最合適的工具。

和一般 prompting 相比，最大優勢是什麼？

最大優勢是「限制與約束」。ab-test-setup 不只是幫你產生 variants，而是幫你界定這個測試值不值得做，以及要如何量測才算有效。多數情況下，這比單純生點子更省時間。

我一定要有非常精確的 traffic 和 conversion 數據嗎？

越精確越好，但方向性的估算也仍然有用。如果你只有粗估值，請明確說明。技能仍然可以產出規劃草稿，只是 sample-size 與 duration 建議的可信度會比較低。

ab-test-setup 可以處理兩個以上的 variants 嗎？

可以，但它也應該提醒你：variants 越多，所需 sample 也會上升。如果流量不高，A/B test 往往會比 A/B/n 或 multivariate testing 更實際。

什麼情況下不該使用 ab-test-setup？

以下情況不建議把它當成主要工具：

tracking 缺漏或不可靠
流量太低，無法做有意義的推論
你需要的是 CRO rewrite，不是 test plan
改動幅度大到真正的阻礙其實是實作可行性
你目前首先需要 analytics instrumentation 設計

這個技能是否綁定特定測試平台？

看不出有平台綁定。這個技能偏重規劃，因此只要你能明確指定 traffic split、metrics 與 implementation constraints，理論上就能搭配大多數 experimentation tools 使用。

ab-test-setup 也能協助 post-test analysis 嗎？

部分可以。templates 裡包含結果文件的結構，但它最強的價值仍然在 pre-launch setup。最好的用法，是在測試開始前就先定義成功條件。

如何改進 ab-test-setup 技能的使用效果

提供更強的 hypothesis，不要只丟 variant 請求

不好的輸入：

Test this new copy against the old copy.

更好的輸入：

Because users may not understand our current value proposition quickly, we believe replacing feature-led copy with outcome-led copy will increase signup starts among first-time visitors. We will measure signup rate as the primary metric and bounce rate plus demo-request rate as secondary checks.

這樣能讓 ab-test-setup 驗證一個具因果邏輯的故事，而不只是比較兩個成品。

提供最基本可用的實驗資料集

若要提升 ab-test-setup 的輸出品質，請盡量固定提供：

baseline conversion rate
traffic volume
minimum meaningful lift
明確的 conversion event
audience
implementation constraints
可接受的 test duration

這些輸入會直接提升 sample-size 邏輯與可行性建議的品質。

避開最常見的失敗模式

輸出偏弱，通常來自以下幾種情況：

太多改動被打包進同一個 test
沒有 baseline metric
把 vanity metric 當成 primary KPI
在不考慮實際 traffic 的前提下要求 significance
測的是上游 micro-metric，但真正商業目標其實在下游

如果你在下 prompt 前先修正這些問題，這個技能會實用很多。

告訴技能哪些指標絕對不能變差

更強的 ab-test-setup skill prompt 會加入 guardrails，例如：

lead quality
refund rate
bounce rate
activation rate
revenue per visitor

這能避免出現那種「表面上贏了、實際上業務品質變差」的假性勝利。

把 sample-size 參考檔當成可行性篩選器

在花時間想 variants 之前，先看 references/sample-size-guide.md。它能幫你回答：

這個測試能否在合理時間內完成？
你想要的 lift 是否小到根本難以偵測？
減少 variants 會不會更聰明？
與其做細微 tweak，是否應該改成更大幅度的變動？

對安裝決策而言，這是 repo 裡價值最高的檔案之一。

優先重用 templates，而不是每次自由發揮

references/test-templates.md 是提升團隊採用率最快的方式。你可以要求模型填寫：

test plan
prioritization scorecard
stakeholder update
hypothesis bank entry

freeform 回答雖然容易產出，但通常比較難真正拿去執行。

第一版完成後，再迭代一次

跑完第一輪 ab-test-setup usage 後，建議再做一次 refinement：

收斂 hypothesis
把範圍縮成單一變數
用可操作的定義取代模糊 metrics
確認 traffic split 與 duration
追問目前還缺哪些 assumptions

很多時候，第二輪修正帶來的改善，會比再多想幾個 variant 還大。

將 ab-test-setup 與相鄰技能搭配使用，但要分工清楚

這個技能本身也指出了相鄰需求：

如果瓶頸在 measurement setup，請用 analytics-tracking
如果你在正式測試前需要頁面優化點子，請用 page-cro

這樣的分工很有用。ab-test-setup 最強的時機，是你已經知道想評估哪個改動，接下來需要一份有效、站得住腳的實驗計畫。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

ua-campaign

作者 Eronred

ua-campaign 技能可協助你規劃並優化行動 App 的付費用戶獲取（UA）活動，重點放在安裝數、CPI、ROAS 與通路組合。當你需要的是可落地的實作方案，而不只是廣告文案時，可用它來做 ua-campaign 風格的決策，涵蓋 Apple Search Ads、Meta、Google UAC、TikTok 及其他成效型通路。

广告优化

收藏 0GitHub 1.2k

referral-program

作者 Eronred

referral-program 可協助你設計、推出並優化應用程式內的推薦或邀請機制，以提升轉換。可用來選擇獎勵、定義邀請流程、評估深層連結依賴、降低作弊風險，並依 CAC 與 LTV 估算獎勵規模。這是一份實用的 referral-program 指南，適合具備真實分享行為的產品。

Conversion

收藏 0GitHub 1.2k

rating-prompt-strategy

作者 Eronred

rating-prompt-strategy 幫你判斷 App 何時、如何、以及要向哪些使用者提出評分或評論邀請，讓你在不打擾使用者的前提下提升星等。這個 rating-prompt-strategy 技能適合用來改善轉換率、優化評論提醒時機，並在低分評價期後進行修復，涵蓋 iOS 與 Android。

Conversion

收藏 0GitHub 1.2k

seo-ecommerce

作者 AgriciDaniel

seo-ecommerce 可用來分析與優化商品頁、Google Shopping 可見度、電商平台定位與商品 schema。可單獨用於頁面 SEO，或搭配 DataForSEO Merchant API 做競品定價與平台關鍵字缺口分析。這個技能是為電商營運與 SEO 團隊設計，提供實用、以證據為基礎的改善建議。

SEO 内容

收藏 0GitHub 0

homepage-audit

作者 BrianRWagner

homepage-audit 是一個以轉換為核心的技能，專門用來稽核首頁與著陸頁，找出頁面為何無法轉換，並把發現整理成優先順序明確的修正方案。當你手上有 URL、截圖或首屏文案，並希望獲得結構化回饋、改寫建議與下一步行動時，就適合使用它。

Conversion

收藏 0GitHub 0

copywriting

作者 coreyhaines31

copywriting skill 可協助代理撰寫或改寫以轉換為導向的網站與登陸頁文案。它會引導頁面架構、先檢查產品與行銷脈絡檔案，並支援首頁、定價頁、功能頁、關於頁與產品頁的實際安裝評估與使用。

Copywriting

收藏 0GitHub 17.3k

onboarding-optimization

作者 Eronred

onboarding-optimization 技能可協助改善首次啟動流程、降低初期流失，並提升啟用率，讓更多新用戶更快達到首次價值。當你需要一套結構化、以轉換為核心的 onboarding-optimization 方法時，可使用這份 onboarding-optimization 指南，從安裝到啟用，提供實用的診斷與迭代下一步，適用於 Conversion。

Conversion

收藏 0GitHub 1.2k

android-aso

作者 Eronred

android-aso 是一個用來提升 Android App 在 Google Play 商店曝光與轉換的 ASO 技能。可用來規劃 title、short description、full description、keywords、ratings、screenshots 與 Play Store experiments，並提供 Google Play 專屬指引，而不是套用泛用的 iOS 建議。這是一份實用的 android-aso 指南，適合用於 SEO 內容與上架決策。

SEO 内容

收藏 0GitHub 1.2k

popup-cro

作者 coreyhaines31

popup-cro 可協助建立並優化用於提升轉換的 popups、modals、slide-ins 與 sticky bars，並提供安裝、設定與使用指引，涵蓋觸發條件、優惠設計、表單阻力、行動裝置 UX、顯示頻率規則，以及產品情境檢查等實用建議。

Conversion

收藏 0GitHub 17.3k

paywall-upgrade-cro

作者 coreyhaines31

paywall-upgrade-cro 可協助團隊優化產品內付費牆、升級畫面、試用到期提示與功能門檻。你可以快速了解何時適合使用、如何安裝、應先讀哪些檔案，以及如何應用在 freemium、trial-to-paid 與方案升級的轉換優化工作。

Conversion

收藏 0GitHub 17.3k

page-cro

作者 coreyhaines31

page-cro 是一款用於檢視行銷頁面並找出實用轉換優化方向的 CRO 技能。可用來分析 landing page、pricing page、homepage、feature page 與 blog page，並根據目標、流量來源、受眾與轉換阻礙提供清楚建議。內容包含安裝指引、工作流程建議、提示詞範例，以及以實驗為核心的使用方式。

Conversion

收藏 0GitHub 17.3k

onboarding-cro

作者 coreyhaines31

onboarding-cro 可協助改善註冊後的新手引導、啟用率與價值實現時間。你可以從 marketingskills repo 安裝，用來診斷 onboarding 阻力、定義 aha moment、優化檢查清單與空狀態，並把成效不佳的首次使用流程轉成可衡量的實驗。

Conversion

收藏 0GitHub 17.3k

lead-magnets

作者 coreyhaines31

lead-magnets 可協助規劃更合適的 lead magnet，用於 email 蒐集與潛在客戶開發。你可以用它挑選內容形式、檢視基準數據、閱讀關鍵檔案，並把 offer 串接到以產品轉換為核心的轉化路徑。

内容行銷

收藏 0GitHub 17.3k

form-cro

作者 coreyhaines31

form-cro 是一個用於稽核與優化非註冊類表單的 skill，適用於名單蒐集、聯絡、預約 demo、申請、問卷、報價與類結帳表單。它可協助團隊降低欄位摩擦、診斷中途放棄原因，並依據 repo 內的指引、eval 範例與清楚的安裝及使用路徑來重整表單。

Conversion

收藏 0GitHub 17.3k

monetization-strategy

作者 phuryn

monetization-strategy 可協助你為產品或功能腦力激盪 3 到 5 種切實可行的營收模式，並一併評估受眾適配度、風險、定價機制與驗證實驗。可將它作為 Pricing Strategy 決策的 monetization-strategy 指南，而不是泛用的賺錢提示詞。

Pricing Strategy

收藏 0GitHub 11k

ab-test-analysis

作者 phuryn

ab-test-analysis 可協助你以統計嚴謹度評估 A/B 測試結果，包含樣本數驗證、信賴區間、顯著性檢定，以及上線／延長／停止建議。適合用於實驗回顧、split test 解讀，以及 Data Analysis 工作流程中的決策判斷。

数据分析

收藏 0GitHub 11k