Data Pipelines

Data Pipelines taxonomy generated by the site skill importer.

6 件のスキル
A
clickhouse-io

作成者 affaan-m

clickhouse-io は、スキーマ設計、分析SQL、取り込みパターン、パフォーマンスチューニングに特化した ClickHouse 向けスキルです。MergeTree の選定、パーティショニング、マテリアライズドビュー、ワークロード別のクエリ最適化を検討する際に役立ちます。

Database Engineering
お気に入り 0GitHub 156.1k
W
airflow-dag-patterns

作成者 wshobson

airflow-dag-patternsは、本番運用を前提としたApache Airflow DAGの設計に役立つスキルです。タスク設計のパターン、依存関係、operators、sensors、テスト、定期実行ジョブのデプロイ指針まで、実務で使いやすい形で整理されています。

Scheduled Jobs
お気に入り 0GitHub 32.6k
W
dbt-transformation-patterns

作成者 wshobson

dbt-transformation-patternsは、staging・intermediate・martsの各レイヤーを軸に、テスト、ドキュメント、incremental modelの設計方針まで含めてdbtプロジェクトを整理する際に役立つスキルです。導入前の検討、新規repoのひな形作成、既存SQLのリファクタリングを通じて、Database Engineeringチーム向けにより整ったanalytics engineeringパターンへ移行したい場面に向いています。

Database Engineering
お気に入り 0GitHub 32.6k
W
spark-optimization

作成者 wshobson

spark-optimization は、Apache Spark ジョブの遅さを partitioning、shuffle、skew、caching、memory tuning の観点から診断するための実践ガイドです。wshobson/agents からスキルを導入し、SKILL.md を確認しながら、Spark UI の症状、クラスタ設定、クエリ傾向に基づいて根拠のある改善策を適用したいときに役立ちます。

Performance Optimization
お気に入り 0GitHub 32.6k
M
data-analytics

作成者 markdown-viewer

data-analytics skill は、ETL、ELT、データレイク、データウェアハウス、ストリーミングパイプライン、ログ分析、BI ダッシュボードを含むデータ分析ワークフロー向けの PlantUML 図を作成します。ソースからデスティネーションへの流れが明確に伝わる表現、AWS の分析・データベース用ステンシル、そして一般的なソフトウェア図やクラウドアーキテクチャ図ではなく、実務で使える data-analytics ガイド出力に最適化されています。

Data Analysis
お気に入り 0GitHub 1.1k
W
ml-pipeline-workflow

作成者 wshobson

ml-pipeline-workflow は、データ準備、学習、検証、デプロイ、監視までを含むエンドツーエンドの MLOps パイプライン設計を実践的に案内するガイドです。再現性のあるワークフロー自動化に向けたオーケストレーションの設計パターンも整理されています。

Workflow Automation
お気に入り 0GitHub 0
Data Pipelines