data-analyst

作者 Shubhamsaboo

data-analyst 是一個精簡的 GitHub skill，會引導代理以 SQL、pandas 與基礎統計分析來進行資料探索。適合希望透過單一 SKILL.md 提示層，就能完成具程式碼支撐的查詢、轉換與結果解讀的使用者。

Stars104.2k

評論0

加入時間2026年4月1日

分類数据分析

安裝指令

npx skills add Shubhamsaboo/awesome-llm-apps --skill data-analyst

編輯評分

此技能評分為 66/100，代表它可列入目錄，適合想找輕量型資料分析提示輔助的使用者，但不宜期待太完整的實務深度。Repository 有清楚說明何時應啟用此技能，以及它涵蓋哪些主題；不過它仍缺乏具體工作流程、範例與實作產物，無法像更成熟的技能那樣大幅降低摸索成本。

66/100

亮點

說明與「When to Apply」段落清楚交代觸發時機，適合資料分析、SQL、pandas 與統計相關需求。
它圍繞分析師常見工作建立出一致的範圍，包括查詢、清理、轉換與模式發掘。
輸出指引要求提供附註解的 SQL/pandas 程式碼、示例結果、效能說明與解讀，比單純角色提示更具可操作性。

注意事項

未提供可直接執行的範例、支援檔案或 install/use 指令，代理需從一般性說明自行推斷實作細節。
技能列出的大方向能力雖廣，但對於何時該用 SQL、pandas 或統計方法，缺少具體限制條件與判斷規則。

Sql Python 分析

總覽

`data-analyst` 技能總覽

data-analyst skill 是一個輕量、聚焦的提示層，專門用於需要 SQL、pandas 與基礎統計推理的 Data Analysis 任務。它特別適合這類使用情境：你手上已經有資料集、資料表 schema、查詢目標，或明確的探索方向，但希望拿到比一般通用聊天提示更可靠、可落地的分析輸出。

`data-analyst` 的設計目標是什麼

這個 data-analyst skill 會把 agent 引導到以下方向：

撰寫用於擷取與轉換資料的 SQL
使用 pandas 進行清理、分組、reshape 與時間序列相關處理
套用描述統計、相關性檢查，以及基本的假設檢定邏輯
回傳程式碼加上解讀，而不只是文字評論

它真正要解決的，不是抽象地「變得更有分析能力」，而是把像「找出 churn drivers」或「幫我探索這個 CSV」這種模糊需求，轉成可以執行的分析步驟、程式碼，以及可供檢視的發現。

哪些人適合安裝 `data-analyst` skill

最適合：

想更快產出 SQL 或 pandas 初稿工作流的分析師
偶爾需要資料探索協助的工程師
想要以程式碼為依據，而不是只看高層建議的 AI 使用者
用 agent 處理 ad hoc analysis、資料清理或探索式診斷的團隊

較不適合：

期待 skill 本身就能自動畫圖、執行 notebook 或連接資料庫的使用者
需要嚴謹模型選擇、因果推論或 production-grade ML pipeline 的進階統計使用者

這個 `data-analyst` skill 和一般提示有什麼不同

data-analyst 最大的優勢在於範圍清楚。這個 skill 明確聚焦在 SQL、pandas 與統計，因此 agent 更有機會：

為問題選對分析工具
產出結構化程式碼，而不是空泛說明
附上註解、範例輸出、效能注意事項與結果解讀
穩定貼近常見的資料分析工作流

和籠統的「analyze this data」提示相比，它在真實工作中更有用，尤其是當你需要的是可以直接執行、或很快改寫上手的結果。

這個 repository 內含什麼

這個 skill 刻意維持極簡。從 repository 可見的內容來看，只有單一的 SKILL.md 檔案，沒有輔助 script、規則、參考資料或 sample dataset。這對採用評估很重要：

安裝與啟用很簡單
行為模式容易理解
幾乎沒有隱藏邏輯
輸出品質高度依賴你的 prompt 與資料脈絡是否完整

如果你要的是一套高度預設立場、附帶測試資產或 decision tree 的框架，這不是那一類。如果你想要的是一個乾淨、可快速叫用的 data-analyst skill，用來處理 SQL／pandas／統計分析工作，它就很合適。

如何使用 `data-analyst` skill

`data-analyst` skill 的安裝情境

如果你的 agent 環境支援 GitHub-hosted skills，可以從包含它的 repository 安裝 data-analyst：

npx skills add Shubhamsaboo/awesome-llm-apps --skill data-analyst

如果你的 client 使用的是不同的 skills loader，則把來源路徑改成：

awesome_agent_skills/data-analyst

由於這個 repo 只暴露 SKILL.md，在你決定是否要試用前，沒有其他額外的 dependency 檔案需要先檢查。

使用 `data-analyst` 前，先讀這個檔案

先看：

awesome_agent_skills/data-analyst/SKILL.md

這個 skill 目錄裡沒有額外的 README.md、metadata.json、rules/ 或 resources/ 檔案，因此幾乎所有可用指引都集中在這一份檔案。請先讀它，理解：

什麼情況下應該使用這個 skill
它預期擅長的能力範圍
偏好的輸出風格

`data-analyst` skill 需要什麼輸入

data-analyst install 這一步很簡單；真正決定結果好壞的，是安裝後你提供給 agent 的輸入。至少要提供以下其中幾項：

資料表 schema 或 CSV 欄位名稱
資料型別與日期欄位
商業問題
範例資料列
期望的粒度、篩選條件或時間範圍
輸出偏好：SQL、pandas、統計說明，或三者都要

弱的輸入：

“Analyze my sales data.”

強的輸入：

“Use the data-analyst skill. I have an orders table with order_id, customer_id, order_date, country, channel, revenue, and is_refunded. Write SQL to calculate monthly revenue, refund rate, and repeat-purchase rate for 2024 by country and channel. Then explain what patterns to look for.”

較強的版本可以大幅減少在指標、維度與時間範圍上的猜測空間。

如何把模糊目標轉成可用的 prompt

一個好的 data-analyst usage prompt 通常包含五個部分：

Context — 你手上有什麼資料集或系統
Question — 你要的是哪個決策支援或洞察
Structure — schema、欄位、joins、日期規則
Constraints — SQL dialect、只能用 pandas、不畫圖等
Output format — query、code、interpretation、validation checks

範例 prompt：

“Use the data-analyst skill for Data Analysis. I need pandas code to inspect a customer support CSV. Columns: ticket_id, created_at, resolved_at, priority, channel, csat_score, agent_id. Clean missing values, compute resolution time in hours, summarize by priority and channel, flag outliers, and explain what metrics might indicate process issues. Assume the file is already loaded into a DataFrame named df.”

處理 SQL 任務時，`data-analyst` 的最佳工作流程

如果工作以 SQL 為主，建議照這個順序提供資訊：

提供 schema 與 join keys
精準定義 metric
如果有差異，指明 SQL dialect
要求同時給 query 與說明
在執行前要求 edge-case 檢查

實用的補充 prompt：

“State any assumptions about nulls, duplicate keys, and date boundaries before writing the final query.”

這樣能改善輸出品質，因為 SQL 出錯往往不是語法問題，而是前提假設沒有講清楚。

處理 pandas 任務時的最佳工作流程

在 pandas 工作流裡，請明確告訴 skill：

DataFrame 名稱
日期是否已經 parse 好
預期資料列數或記憶體限制
你要的是一次性分析，還是可重複使用的轉換程式碼

更強的 pandas 請求方式：

“Use pandas only. df has 4 million rows, so avoid unnecessary copies. Show memory-conscious cleaning steps, groupby summaries, and missing-value diagnostics.”

這能幫助 agent 選擇更貼近實務的程式碼，而不是玩具級範例。

如何更有效地要求統計分析

當統計問題夠具體時，data-analyst guide 才最有價值。建議明確提出：

假設是什麼
涉及哪些變數
是否有比較組別
你需要多高程度的嚴謹性

較好的問法：

“Compare average order value between paid search and organic traffic. Recommend an appropriate significance test, explain assumptions, and show pandas code to run it.”

較差的問法：

“Do some stats on this data.”

這個 skill 涵蓋描述統計、相關性分析與基礎檢定邏輯，但當決策風險很高時，它不能取代專門的統計審查。

使用 `data-analyst` 時，預期會得到什麼輸出

根據 skill 定義，好的輸出通常應包含：

SQL queries 或 pandas code
清楚的註解
範例結果
效能考量
對結果的解讀

這種輸出形式在實務上很有價值，因為你不只拿到可執行內容，也有足夠的說明可以在真正執行前先做 sanity check。

能提升 `data-analyst` 輸出品質的實用技巧

只要對 prompt 做些小升級，就能明顯改善 data-analyst for Data Analysis 工作流：

明確說明你要的是探索分析，還是最終 metric。
告知資料是否凌亂、稀疏或欄位很多。
提到你懷疑的問題，例如 duplicates、缺失 timestamp 或分類不一致。
不只要主查詢，也要求 validation queries。
如果存在取捨，要求提供替代方案。

範例：

“After the main SQL, add a validation query to check duplicate customer_id + order_date combinations and null rates in revenue columns.”

這個 skill 不會幫你做哪些事

因為這個 skill 本質上只有一份 prompt 檔案，它本身不會：

連接資料庫
執行 SQL
載入檔案
掃描你的執行環境
保證統計結論正確

你仍然需要自己的 runtime、資料庫權限與判斷能力。這個 skill 改善的是 agent 的分析框架，不是取代工具或領域審查。

`data-analyst` skill 常見問題

如果我平常已經用一般 prompt，還值得安裝 `data-analyst` skill 嗎？

通常值得，尤其如果你常要求 SQL、pandas 或探索式分析。它的價值不在隱藏式自動化，而在於提供更好的預設分析姿態。一般 prompt 可能只會給你寬泛回答；data-analyst 更有機會提供符合分析師工作情境的程式碼、前提假設與解讀。

`data-analyst` skill 對新手友善嗎？

算是友善，但有一個前提：新手仍然需要提供 schema 與業務背景。這個 skill 可以幫你把分析架構整理出來，但無法拯救定義過於模糊的需求。如果你剛接觸 SQL 或 pandas，可以要求它逐步解釋，並在程式碼中加入大量註解。

什麼情況下不該使用 `data-analyst`？

如果你的任務主要是以下類型，就不建議用 data-analyst：

dashboard 設計
進階機器學習
因果推論
data engineering orchestration
以視覺化為核心的工作

它最擅長的是探索式分析、轉換邏輯、查詢撰寫，以及相對直接的統計推理。

`data-analyst` 支援特定資料庫或函式庫堆疊嗎？

這個 skill 會提到 SQL、Python 搭配 pandas，以及統計分析，但並沒有把你綁死在某一個 SQL engine 或某一種資料平台上。這種彈性很實用，但也表示只要情境需要，你就應該主動說明 dialect，例如 PostgreSQL、BigQuery、Snowflake 或 SQLite。

這個 skill 足以應付 production analytics 工作嗎？

它可以加速 production 工作，但本身不構成 production 保證。你仍然要檢查生成 SQL 的效能、和利害關係人確認 metric 定義，並在真實資料上驗證輸出。這個 skill 是草稿與推理輔助工具，不是執行正確性的保證。

如何改進 `data-analyst` skill 的使用效果

給 `data-analyst` skill 更完整的分析脈絡

影響品質最大的槓桿，是脈絡密度。請盡量提供：

schema
商業定義
sample records
已知的資料品質問題
成功標準

沒有這些資訊時，skill 依然可能回得很流暢，但分析內容很容易偏離你真正的 metric 邏輯。

在產出最終程式碼前，先要求列出假設

提升 data-analyst skill 輸出品質最有效的方法之一，就是先把假設攤開來說。

可以試試：

“Before writing the final SQL, list assumptions about joins, null handling, duplicate events, and time windows.”

這能提早攔下常見失誤：

one-to-many joins 導致的灌水計數
日期粒度選錯
類別值解讀錯誤
不成立的統計比較

不只要答案，也要要求 validation steps

高品質的 data-analyst guide prompt，會要求模型驗證自己的工作。

實用補充語句：

“Provide one validation query.”
“Show sanity checks for row counts before and after filtering.”
“Point out which result would be suspicious and why.”
“List possible confounders before interpreting the correlation.”

很多時候，這比要求更長篇的解釋還有價值。

如果第一版答案太發散，就縮小任務範圍

如果初次回覆把 SQL、pandas 和統計一次混在一起，建議把工作流拆開：

理解 schema
撰寫 extraction query
清理／轉換
統計解讀
對利害關係人做摘要

當每一輪只聚焦單一分析目標時，data-analyst skill 的表現通常會更好。

用 runtime 限制來提升 pandas 結果品質

只要你告訴模型哪些執行面向重要，pandas 輸出通常會更實用：

對記憶體是否敏感
偏 notebook 還是 script 風格
是否偏好 vectorized operations
可讀性與速度之間怎麼取捨

範例：

“Optimize for readable notebook code, but avoid row-wise apply unless necessary.”

這類指示會實際改變程式碼品質，而這正是一般泛用 prompt 常忽略的地方。

迭代的不只應該是程式碼，也要包含結果解讀

拿到第一版答案後，可以繼續追問：

“Which conclusion is strongest, and what evidence supports it?”
“What could make this result misleading?”
“What segment cut would you check next?”
“What additional column would most improve confidence?”

這正是 data-analyst for Data Analysis 不只是產生程式碼的地方。它可以幫你從資料擷取，進一步走到決策支援。

使用 `data-analyst` 時要留意的常見失誤

即使用了 data-analyst skill，仍然要檢查輸出是否有以下問題：

join 錯誤
未說明的 metric 假設
null handling 錯誤
過度自信的統計結論
範例輸出與你的 schema 不相符
在大表上效率不佳的 SQL

這個 skill 精簡而實用，但沒有被大量規則或測試夾具深度約束，所以你的審查流程仍然非常重要。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是一個用於資料庫工程的 ClickHouse 最佳實務技能。它以規則式建議引導 schema 設計、查詢調校、寫入策略與 agent 連線，讓 clickhouse-best-practices 在 ClickHouse 工作流程中的使用更容易被觸發、審查與引用。

資料庫工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一個相容 pandas 的技能，透過 ClickHouse 支援的 DataStore API 提供快速資料分析。它支援檔案、資料庫與雲端連接器、跨來源 JOIN，以及只需極少程式碼變更的 pandas 風格工作流程。當你需要一個可直接替換、用於較大資料集的分析層時，可以使用這份 chdb-datastore 指南。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中進行精確的符號數學運算，涵蓋代數、微積分、矩陣、物理公式、數論、幾何與程式碼生成。它能幫助你維持表達式的精確性、選對 SymPy 模組，並避免過度依賴浮點數造成的錯誤。最適合需要實用 sympy 指南來處理符號工作流程，以及在 Data Analysis 中使用 sympy 的使用者。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可協助解讀 Culture Index 問卷、個人檔案匯出內容，以及相關的招募或教練筆記。這個 interpreting-culture-index 技能適合用於職務適配、團隊動態、倦怠風險、候選人回饋簡報、入職規劃與衝突調解。它強調依箭頭相對位置來閱讀、檢查反模式，以及產出實用的分析結果，支援資料分析與決策判斷。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是 Python 版的 Azure AI Search 技能，適合後端開發，涵蓋安裝、驗證、索引設計、向量搜尋、混合搜尋、語意排序與 agentic retrieval。當你需要從環境設定一路到可運作的查詢模式的實作指引時，適合使用 azure-search-documents-py 技能。

後端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一個生物資訊技能，可透過 CLI 或 Python 快速、統一地存取 20+ 個基因組資料庫與分析工具。適合查詢基因資訊、BLAST 相關資料、AlphaFold 結構、表現量資料、疾病關聯，以及進行類 enrichment 分析。它很適合快速探索，以及 gget for Data Analysis 工作流程。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

適用於 PyTorch Geometric 圖神經網路的 torch-geometric 技能指南。可用來取得 torch-geometric 安裝協助、torch-geometric 使用方式、圖分類、節點分類、連結預測、異質圖、自訂 MessagePassing 層，以及為 Machine Learning 工作流程擴展 GNN。

Machine Learning

收藏 0GitHub 21.4k

rdkit

作者 K-Dense-AI

rdkit 技能可協助你精準處理化學資訊工作流程：解析 SMILES、SDF、MOL、PDB 與 InChI；計算描述子；產生指紋；執行子結構搜尋；處理反應；以及建立 2D/3D 座標。這份 rdkit 指南適合進階控制、自訂清理，以及用 rdkit 進行 Data Analysis 工作流程。

数据分析

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 可協助你安裝並使用一套 Hugging Face 視覺訓練技能，支援物件偵測、影像分類，以及 SAM/SAM2 分割等訓練工作。內容涵蓋資料集準備、雲端 GPU 環境設定、評估、Trackio 記錄與將結果推送到 Hub。很適合後端自動化與可重複的訓練流程。

後端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 透過 DataForSEO MCP server 將 Claude 連接到即時 SEO 資料，支援 SERP 檢查、關鍵字研究、反向連結、頁面內分析、競品研究、商家資訊，以及 AI 可見度追蹤。這個技能特別適合需要真實搜尋證據、清楚安裝指引與實用 seo-dataforseo 用法的資料導向工作流程。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一項用於在 Python 中建立、擬合、檢查與比較機率模型的 Bayesian 建模技能。可用 pymc 進行階層式迴歸、多層次分析、時間序列、缺失值、量測誤差，以及搭配 LOO 或 WAIC 的模型比較。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一套用於晶體結構、相圖、電子結構與檔案轉換的 Python 材料科學工具組。這個 pymatgen 技能可協助處理包含 CIF、POSCAR、VASP 與 Materials Project 資料的科學工作流程。

Scientific

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

geopandas 的 Python 地理空間向量資料分析技能，涵蓋 shapefiles、GeoJSON 與 GeoPackage 檔案。可用來讀取、清理、合併、建立緩衝區、裁切、重新投影與匯出空間資料，減少試錯。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

Analyzing-threat-intelligence-feeds 可協助你匯入 CTI feeds、標準化指標、評估 feed 品質，並為 STIX 2.1 工作流程強化 IOCs。這個 analyzing-threat-intelligence-feeds 技能專為威脅情資作業與資料分析而設，提供 TAXII、MISP 與商業 feeds 的實務指引。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是一個用於 Python 中 Azure AI Text Analytics 的技能。它可協助進行情感分析、實體辨識、關鍵片語擷取、語言偵測、PII 偵測與醫療保健 NLP。當你需要快速完成 Azure 用戶端設定、驗證，以及在應用程式、Notebook 或資料分析工作流程中實作實用的文字分析時，這個技能很適合。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一個 GitHub 技能，可在 Python 中直接執行 ClickHouse SQL，且不需要伺服器。內容涵蓋 chdb.query()、Session、DB-API 連線、像 file() 與 s3() 這類表格函式、參數化查詢，以及針對本機檔案與外部資料來源的後端開發工作流程。

後端开发

收藏 0GitHub 0

data-analyst

data-analyst 技能總覽

data-analyst 的設計目標是什麼

哪些人適合安裝 data-analyst skill

這個 data-analyst skill 和一般提示有什麼不同

這個 repository 內含什麼

如何使用 data-analyst skill

data-analyst skill 的安裝情境

使用 data-analyst 前，先讀這個檔案

data-analyst skill 需要什麼輸入

如何把模糊目標轉成可用的 prompt

處理 SQL 任務時，data-analyst 的最佳工作流程

處理 pandas 任務時的最佳工作流程

如何更有效地要求統計分析

使用 data-analyst 時，預期會得到什麼輸出

能提升 data-analyst 輸出品質的實用技巧

這個 skill 不會幫你做哪些事

data-analyst skill 常見問題

如果我平常已經用一般 prompt，還值得安裝 data-analyst skill 嗎？

data-analyst skill 對新手友善嗎？

什麼情況下不該使用 data-analyst？

data-analyst 支援特定資料庫或函式庫堆疊嗎？

這個 skill 足以應付 production analytics 工作嗎？

如何改進 data-analyst skill 的使用效果

給 data-analyst skill 更完整的分析脈絡

在產出最終程式碼前，先要求列出假設

不只要答案，也要要求 validation steps

如果第一版答案太發散，就縮小任務範圍

用 runtime 限制來提升 pandas 結果品質

迭代的不只應該是程式碼，也要包含結果解讀

使用 data-analyst 時要留意的常見失誤

評分與評論

`data-analyst` 技能總覽

`data-analyst` 的設計目標是什麼

哪些人適合安裝 `data-analyst` skill

這個 `data-analyst` skill 和一般提示有什麼不同

如何使用 `data-analyst` skill

`data-analyst` skill 的安裝情境

使用 `data-analyst` 前，先讀這個檔案

`data-analyst` skill 需要什麼輸入

處理 SQL 任務時，`data-analyst` 的最佳工作流程

使用 `data-analyst` 時，預期會得到什麼輸出

能提升 `data-analyst` 輸出品質的實用技巧

`data-analyst` skill 常見問題

如果我平常已經用一般 prompt，還值得安裝 `data-analyst` skill 嗎？

`data-analyst` skill 對新手友善嗎？

什麼情況下不該使用 `data-analyst`？

`data-analyst` 支援特定資料庫或函式庫堆疊嗎？

如何改進 `data-analyst` skill 的使用效果

給 `data-analyst` skill 更完整的分析脈絡

使用 `data-analyst` 時要留意的常見失誤