data-analyst

作成者 Shubhamsaboo

data-analyst は、データ探索のために SQL、pandas、基礎的な統計分析へエージェントを導く、最小構成の GitHub スキルです。単一の SKILL.md プロンプト層で、コードに基づくクエリ、変換、解釈までまとめて引き出したいユーザーに向いています。

スター104.2k

お気に入り0

追加日2026年4月1日

カテゴリーData Analysis

インストールコマンド

npx skills add Shubhamsaboo/awesome-llm-apps --skill data-analyst

編集スコア

このスキルの評価は 66/100 です。軽量なデータ分析向けプロンプト支援を求めるディレクトリ利用者には掲載可能な水準ですが、運用面の深さは限定的と見ておくべきです。リポジトリでは、いつ呼び出すべきか、何を扱うスキルかは比較的明確に示されています。一方で、より強いスキルであれば備えているような、推測を減らせる具体的なワークフロー、例、実装用の成果物までは用意されていません。

66/100

強み

説明文と「When to Apply」セクションが明確で、データ分析、SQL、pandas、統計に関する依頼で発動させやすくなっています。
クエリ作成、クリーニング、変換、パターン発見といった、アナリストの定番タスクに沿った一貫した対象範囲が定義されています。
出力ガイドでは、コメント付きの SQL / pandas コード、結果例、性能面の補足、解釈まで求めており、単なる役割指定のプロンプトより実務で使いやすい内容です。

注意点

実行可能な例、補助ファイル、導入・使用コマンドがなく、実行の細部は汎用的な説明からエージェント側で補う必要があります。
対応範囲は広く示されている一方で、状況に応じて SQL・pandas・統計手法をどう使い分けるかという制約や判断基準はあまり示されていません。

Sql Python Analytics

概要

data-analystスキルの概要

data-analystスキルは、SQL、pandas、基本的な統計的思考を必要とするData Analysis向けに設計された、軽量で焦点のはっきりしたプロンプトレイヤーです。すでにデータセット、テーブルスキーマ、クエリの目的、あるいは探索したい問いがあり、汎用的なチャットプロンプトよりも安定して信頼しやすい分析アウトプットを得たいユーザーに向いています。

data-analystが得意なこと

このdata-analystスキルは、エージェントの出力を次の方向に導きます。

抽出・変換のためのSQLを書く
pandasでクリーニング、グルーピング、リシェイプ、時系列処理を行う
記述統計、相関確認、シンプルな仮説検定のロジックを適用する
コメントだけでなく、コードと解釈をセットで返す

このスキルの本質は、抽象的に「分析っぽく振る舞う」ことではありません。たとえば「解約要因を見つけたい」「このCSVを探索したい」といった曖昧な依頼を、実行可能な分析ステップ、コード、そして確認可能な示唆に変えることです。

data-analystスキルを入れるべき人

特に相性が良いのは、次のようなケースです。

SQLやpandasの初稿をもっと速く作りたいアナリスト
ときどきデータ探索が必要になるエンジニア
抽象的な助言ではなく、コード付きの回答を求めるAI利用者
アドホック分析、データクリーニング、探索的診断にエージェントを使うチーム

あまり向かないのは、次のような期待を持つ場合です。

スキル単体で自動グラフ描画、ノートブック実行、DB接続までしてくれると思っているユーザー
厳密なモデル選定、因果推論、本番品質のMLパイプラインを必要とする上級統計ユーザー

汎用プロンプトと比べたdata-analystスキルの違い

data-analystの最大の強みは、扱う範囲が明確なことです。SQL、pandas、統計に明示的に軸足を置いているため、エージェントは次のように振る舞いやすくなります。

問いに合った分析手段を選ぶ
ふわっとした説明ではなく、構造化されたコードを出す
コメント、出力例、性能面の注意、解釈を含める
一般的なデータ分析ワークフローから逸れにくい

そのため、すぐ実行できるものや、少し直して流用できるものが必要な場面では、広すぎる「このデータを分析して」系のプロンプトより実務で使いやすいスキルです。

リポジトリに含まれているもの

このスキルは意図的にミニマルです。リポジトリ上で確認できるのはSKILL.md 1ファイルのみで、補助スクリプト、ルール、参考資料、サンプルデータセットは含まれていません。この点は導入判断に関わります。

セットアップは簡単
挙動を把握しやすい
裏側の隠れたロジックが少ない
出力品質は、与えるプロンプトとデータ文脈の質に大きく左右される

テスト用アセットや意思決定ツリーまで揃った、強く設計されたフレームワークを求めるなら別を探したほうがよいでしょう。一方、SQL / pandas / 統計作業のためにすぐ呼び出せる、クリーンなdata-analyst skillが欲しいなら十分に相性が良いです。

data-analystスキルの使い方

data-analystスキルのインストール前提

エージェント環境がGitHubホストのスキルに対応しているなら、data-analystはそれを含むリポジトリからインストールできます。

npx skills add Shubhamsaboo/awesome-llm-apps --skill data-analyst

もし利用中のクライアントが別のskills loaderを使っている場合は、ソースパスを次の形に合わせてください。

awesome_agent_skills/data-analyst

このリポジトリで公開されているのはSKILL.mdだけなので、試す前に追加で確認すべき依存ファイルはありません。

data-analystを使う前にまず読むべきファイル

最初に確認すべきなのは、次のファイルです。

awesome_agent_skills/data-analyst/SKILL.md

このスキルディレクトリには、補助的なREADME.md、metadata.json、rules/、resources/はありません。実際に使えるガイダンスのほぼすべてが、その1ファイルに入っています。読むべきポイントは次のとおりです。

どんな場面でこのスキルを使うべきか
期待されている対応領域は何か
どんな出力スタイルが望ましいか

data-analystスキルに必要な入力情報

data-analyst install自体は簡単ですが、良い結果が出るかどうかは、インストール後に何を渡すかで決まります。最低でも、次のうちいくつかはエージェントに伝えてください。

テーブルスキーマ、またはCSVの列名
データ型と日付フィールド
ビジネス上の問い
サンプル行
必要な粒度、フィルタ、期間
出力希望: SQL、pandas、統計説明、またはその全部

弱い入力例:

“Analyze my sales data.”

強い入力例:

“Use the data-analyst skill. I have an orders table with order_id, customer_id, order_date, country, channel, revenue, and is_refunded. Write SQL to calculate monthly revenue, refund rate, and repeat-purchase rate for 2024 by country and channel. Then explain what patterns to look for.”

後者のほうが、指標、ディメンション、時間範囲の推測を減らせるため、精度が大きく上がります。

roughな目的を使えるプロンプトに変える方法

良いdata-analyst usageプロンプトは、たいてい次の5要素で構成されます。

Context — 手元にあるデータセットやシステムは何か
Question — 欲しい意思決定材料や洞察は何か
Structure — スキーマ、列、join、日付ルール
Constraints — SQL dialect、pandas only、no plotting など
Output format — query、code、interpretation、validation checks

プロンプト例:

“Use the data-analyst skill for Data Analysis. I need pandas code to inspect a customer support CSV. Columns: ticket_id, created_at, resolved_at, priority, channel, csat_score, agent_id. Clean missing values, compute resolution time in hours, summarize by priority and channel, flag outliers, and explain what metrics might indicate process issues. Assume the file is already loaded into a DataFrame named df.”

SQLタスクでの最適な進め方

SQL中心の作業では、次の順番が有効です。

スキーマとjoin keyを渡す
指標の定義を明確にする
必要ならSQL dialectを指定する
クエリと説明の両方を求める
実行前にエッジケース確認も依頼する

追加すると有効な一文:

“State any assumptions about nulls, duplicate keys, and date boundaries before writing the final query.”

これは、SQLの失敗原因が構文ではなく、明示されていない前提にあることが多いためです。

pandasタスクでの最適な進め方

pandasを使わせる場合は、少なくとも次を伝えると精度が上がります。

DataFrame名
日付がすでにparse済みかどうか
想定行数、またはメモリ制約
一回限りの分析なのか、再利用可能な変換コードが必要なのか

より良いpandas依頼の例:

“Use pandas only. df has 4 million rows, so avoid unnecessary copies. Show memory-conscious cleaning steps, groupby summaries, and missing-value diagnostics.”

こうすると、教材っぽい小規模サンプルではなく、実運用を意識したコードを選びやすくなります。

統計分析をうまく依頼する方法

data-analyst guideが特に役立つのは、統計的な問いが具体的なときです。依頼時には次を含めてください。

仮説
対象となる変数
比較群があるかどうか
どの程度の厳密さが必要か

より良い例:

“Compare average order value between paid search and organic traffic. Recommend an appropriate significance test, explain assumptions, and show pandas code to run it.”

良くない例:

“Do some stats on this data.”

このスキルは記述統計、相関分析、基本的な検定ロジックには対応していますが、意思決定のインパクトが大きい場面では、専門的な統計レビューの代替にはなりません。

data-analyst usageで期待できる出力

スキル定義に沿えば、良い出力には次の要素が含まれるはずです。

SQLクエリまたはpandasコード
明確なコメント
結果例
パフォーマンス上の考慮
発見内容の解釈

実務で価値があるのは、単に「答え」が返るからではなく、実行できるものと、実行前にロジックを点検するための説明がセットになっているからです。

出力品質を上げる実践的なコツ

ちょっとしたプロンプト改善でも、data-analyst for Data Analysisのワークフローはかなり良くなります。

探索がしたいのか、最終指標が欲しいのかを明示する
データが汚れている、疎である、横持ちで広い、などの性質を伝える
重複、欠損タイムスタンプ、カテゴリ不整合のような懸念を共有する
メインクエリだけでなく、検証用クエリも求める
トレードオフがあるなら代替案も出させる

例:

“After the main SQL, add a validation query to check duplicate customer_id + order_date combinations and null rates in revenue columns.”

このスキルがやってくれないこと

このスキルはプロンプトファイルだけなので、次のことは自動では行いません。

データベース接続
SQL実行
ファイル読み込み
実行環境のプロファイリング
統計的妥当性の保証

つまり、実行基盤、DBアクセス、最終判断は引き続き自分で用意する必要があります。このスキルはエージェントの分析フレーミングを改善するものであり、ツールやドメインレビューそのものを置き換えるものではありません。

data-analystスキル FAQ

すでに普通のプロンプトを使っていてもdata-analystスキルを入れる価値はある？

多くの場合、あります。特にSQL、pandas、探索分析を頻繁に依頼するなら有効です。価値の源泉は隠れた自動化ではなく、分析向けの初期姿勢が良くなることにあります。汎用プロンプトは広く答えがちですが、data-analystは、アナリストの一般的な作業に沿ったコード、前提、解釈を返しやすいのが強みです。

data-analystスキルは初心者にも使いやすい？

はい。ただし注意点が1つあります。初心者でも、スキーマとビジネス文脈はある程度渡す必要があります。このスキルは分析の組み立てを助けてくれますが、要件が曖昧すぎる依頼まで救ってくれるわけではありません。SQLやpandasに不慣れなら、各ステップの説明と、厚めのコードコメントを求めると使いやすくなります。

どんなときはdata-analystを使わないほうがいい？

次のタスクが主目的なら、data-analystは外したほうがよいです。

ダッシュボード設計
高度な機械学習
因果推論
データエンジニアリングのオーケストレーション
可視化特化の作業

このスキルが最も力を発揮するのは、探索分析、変換ロジック、クエリ作成、比較的ストレートな統計的推論です。

data-analystは特定のデータベースやライブラリ構成に対応している？

スキル内ではSQL、Python with pandas、統計分析に触れていますが、特定のSQL engineやデータプラットフォームに固定はされていません。この柔軟さは便利ですが、そのぶん必要に応じてdialectを明示すべきです。たとえばPostgreSQL、BigQuery、Snowflake、SQLiteなどです。

このスキルだけで本番分析に十分？

本番作業の加速には役立ちますが、これだけで本番品質が担保されるわけではありません。生成されたSQLの性能を確認し、指標定義を関係者とすり合わせ、実データで出力を検証してください。このスキルはドラフト作成と分析思考の補助にはなりますが、実行結果の保証まではしてくれません。

data-analystスキルを改善する方法

data-analystスキルに、より濃い分析コンテキストを渡す

最大の品質レバーは、コンテキストの密度です。次の情報を含めてください。

スキーマ
ビジネス定義
サンプルレコード
既知のデータ品質問題
成功条件

これらがないと、スキルは流暢には答えてくれても、実際に欲しい指標ロジックから分析がずれていくことがあります。

最終コードの前に前提を言語化させる

data-analyst skillの出力を改善するもっとも効果的な方法の1つは、前提を表に出させることです。

試す価値がある指示:

“Before writing the final SQL, list assumptions about joins, null handling, duplicate events, and time windows.”

これにより、よくある失敗を早い段階で拾えます。

1対多joinによる件数の水増し
日付粒度の取り違え
カテゴリ値の誤読
不適切な統計比較

答えだけでなく検証ステップも要求する

質の高いdata-analyst guideプロンプトは、モデルに自分の結果を検証させます。

追加すると有効な指示:

“Provide one validation query.”
“Show sanity checks for row counts before and after filtering.”
“Point out which result would be suspicious and why.”
“List possible confounders before interpreting the correlation.”

多くの場合、説明を長くさせるより、こちらのほうが実用価値は高いです。

最初の回答が広すぎるなら、タスクを分割する

初回回答でSQL、pandas、統計が一気に混ざるようなら、ワークフローを分けてください。

スキーマ理解
抽出クエリ
クリーニング / 変換
統計的解釈
ステークホルダー向け要約

data-analystスキルは、1回ごとの目的が1つに絞られているほうが安定して機能します。

実行条件を伝えてpandasの結果を良くする

pandasの出力は、運用上何が重要かを伝えると改善しやすくなります。

メモリ感度
notebookかscriptか
vectorized operationsを優先するか
可読性と速度のどちらを重視するか

例:

“Optimize for readable notebook code, but avoid row-wise apply unless necessary.”

この種の指示は、汎用プロンプトでは見落とされがちなコード品質の差につながります。

コードだけでなく解釈の質も反復改善する

最初の回答のあとで、次のようなフォローアップを入れてください。

“Which conclusion is strongest, and what evidence supports it?”
“What could make this result misleading?”
“What segment cut would you check next?”
“What additional column would most improve confidence?”

ここで、data-analyst for Data Analysisは単なるコード生成以上の存在になります。抽出作業から意思決定支援へ進める助けになります。

data-analystで注意したい典型的な失敗パターン

data-analystスキルを使っていても、次の点は必ず見直してください。

不正確なjoin
明示されていない指標前提
null処理のミス
過度に自信のある統計的主張
自分のスキーマに合っていない出力例
大規模テーブルに対して非効率なSQL

このスキルはコンパクトで便利ですが、厳密なルールやテストフィクスチャで深く縛られているわけではありません。最終的には、使う側のレビュー工程が重要です。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

clickhouse-best-practices

作成者 ClickHouse

clickhouse-best-practicesは、Database Engineering向けのClickHouseベストプラクティス skill です。スキーマ設計、クエリチューニング、insert戦略、エージェント接続を、ルールベースの推奨で整理して案内します。clickhouse-best-practices の使いどころを見極めやすく、レビューや引用にもつなげやすいので、ClickHouse のワークフローで活用しやすいのが特長です。

Database Engineering

お気に入り 0GitHub 412

chdb-datastore

作成者 ClickHouse

chdb-datastore は、ClickHouse バックエンドの DataStore API を使って高速なデータ分析を行うための pandas 互換スキルです。ファイル、データベース、クラウドの各コネクタ、異なるソースをまたぐ join、そして pandas 風ワークフローをほとんど変えずに使える点が特長です。大きめのデータセットに対して、そのまま使える分析レイヤーを求めるなら、この chdb-datastore ガイドが役立ちます。

Data Analysis

お気に入り 0GitHub 0

sympy

作成者 K-Dense-AI

sympyスキルを使って、Pythonでの厳密なシンボリック計算を行えます。代数、微積分、行列、物理式、数論、幾何、コード生成まで幅広く対応。式を厳密に保ち、適切なSymPyモジュールを選び、浮動小数点中心の誤りを避けるのに役立ちます。シンボリックなワークフローやData Analysisでのsympy活用を実践的に学びたい人に最適です。

Data Analysis

お気に入り 0GitHub 21.4k

interpreting-culture-index

作成者 trailofbits

interpreting-culture-index は、Culture Index のサーベイ、プロフィール書き出し、関連する採用・コーチングメモの解釈を支援します。役割適合、チームの力学、バーンアウトリスク、候補者の振り返り、オンボーディング計画、対立の仲裁にこの interpreting-culture-index skill を使ってください。矢印の相対関係を基準に読む考え方、アンチパターンの確認、データ分析と意思決定支援につながる実践的な出力を重視しています。

Data Analysis

お気に入り 0GitHub 5k

azure-search-documents-py

作成者 microsoft

azure-search-documents-py は、Python 向けの Azure AI Search スキルです。バックエンド開発を対象に、インストール、認証、インデックス設計、ベクトル検索、ハイブリッド検索、セマンティックランキング、エージェント的検索までをカバーします。セットアップから実用的なクエリパターンまで、具体的な指針が必要なときにこの azure-search-documents-py スキルを使ってください。

Backend Development

お気に入り 0GitHub 2.3k

gget

作成者 K-Dense-AI

ggetは、CLIまたはPythonから20以上のゲノムデータベースと解析ツールへ高速かつ統一的にアクセスできる生物情報学スキルです。遺伝子情報、BLAST関連の検索、AlphaFold構造、発現データ、疾患関連、エンリッチメント系の解析に使えます。素早い探索や、ggetを使ったData Analysisワークフローに向いています。

Data Analysis

お気に入り 0GitHub 0

torch-geometric

作成者 K-Dense-AI

PyTorch Geometric のグラフニューラルネットワーク向け torch-geometric スキルガイドです。torch-geometric のインストール支援、torch-geometric の使い方、グラフ分類、ノード分類、リンク予測、異種グラフ、カスタム MessagePassing レイヤー、Machine Learning ワークフローでの GNN のスケーリングに役立ちます。

Machine Learning

お気に入り 0GitHub 21.4k

rdkit

作成者 K-Dense-AI

rdkit skill は、SMILES、SDF、MOL、PDB、InChI の解析、記述子の計算、フィンガープリント生成、部分構造検索、反応処理、2D/3D 座標の生成など、精密な化学情報ワークフローを支援します。高度な制御、カスタムサニタイズ、Data Analysis ワークフローでの rdkit 活用を確認したい場合に使えるガイドです。

Data Analysis

お気に入り 0GitHub 21.4k

huggingface-vision-trainer

作成者 huggingface

huggingface-vision-trainer は、物体検出、画像分類、SAM/SAM2 のセグメンテーションといった Hugging Face のビジョントレーニングジョブを導入・活用するためのスキルです。データセット準備、クラウド GPU のセットアップ、評価、Trackio ロギング、結果の Hub へのプッシュまでをカバーします。バックエンド自動化や再現性の高い学習ワークフローに最適です。

Backend Development

お気に入り 0GitHub 10.4k

seo-dataforseo

作成者 AgriciDaniel

seo-dataforseo は、DataForSEO MCP サーバーを通じて Claude をライブの SEO データにつなぎ、SERP 確認、キーワード調査、被リンク、オンページ分析、競合調査、ビジネスリスティング、AI 可視性トラッキングを可能にします。実際の検索根拠が必要で、導入判断をしやすい明確な手順と、実務に使える seo-dataforseo の活用法を求めるデータ重視のワークフローに最適です。

Keyword Research

お気に入り 0GitHub 6.2k

pymc

作成者 K-Dense-AI

PyMCは、Pythonでベイズモデルを構築・推定・検証・比較するためのスキルです。pymcは、階層回帰、マルチレベル分析、時系列、欠損データ、測定誤差、LOOやWAICによるモデル比較に使えます。

Data Analysis

お気に入り 0GitHub 0

pymatgen

作成者 K-Dense-AI

pymatgen は、結晶構造、相図、電子構造、ファイル変換を扱う Python の材料科学向けツールキットです。この pymatgen スキルは、CIF、POSCAR、VASP、Materials Project のデータを使う科学ワークフローを支援します。

Scientific

お気に入り 0GitHub 0

geopandas

作成者 K-Dense-AI

Pythonでのgeopandasによる地理空間ベクターデータ分析向けスキルです。shapefiles、GeoJSON、GeoPackageファイルを扱えます。空間データの読み込み、整形、結合、バッファ作成、クリップ、再投影、書き出しを、迷いを少なく進められます。

Data Analysis

お気に入り 0GitHub 0

analyzing-threat-intelligence-feeds

作成者 mukul975

analyzing-threat-intelligence-feeds は、CTI フィードの取り込み、インジケーターの正規化、フィード品質の評価、STIX 2.1 ワークフロー向けの IOC 強化を支援します。脅威インテリジェンス運用とデータ分析向けに設計された analyzing-threat-intelligence-feeds スキルで、TAXII、MISP、商用フィードを使う実務に役立つガイドが含まれています。

Data Analysis

お気に入り 0GitHub 0

azure-ai-textanalytics-py

作成者 microsoft

azure-ai-textanalytics-py は、Python で Azure AI Text Analytics を扱うための skill です。感情分析、エンティティ認識、キーフレーズ抽出、言語判定、PII 検出、医療分野の NLP に対応します。Azure クライアントのセットアップ、認証、実践的なテキスト分析を、アプリ、ノートブック、データ分析ワークフローですばやく始めたいときに向いています。

Data Analysis

お気に入り 0GitHub 0

chdb-sql

作成者 ClickHouse

chdb-sql は、サーバーなしで Python から ClickHouse SQL を実行するための GitHub スキルです。`chdb.query()`、`Session`、DB-API 接続、`file()` や `s3()` などのテーブル関数、パラメータ化クエリ、ローカルファイルや外部データソースを使ったバックエンド開発ワークフローをカバーします。

Backend Development

お気に入り 0GitHub 0