Data Pipelines

Data Pipelines taxonomy generated by the site skill importer.

6 個技能
A
clickhouse-io

作者 affaan-m

clickhouse-io 是一個以 ClickHouse 為核心的技能,涵蓋 schema 設計、分析型 SQL、資料匯入模式與效能調校。可用來引導 MergeTree 的選擇、分區、materialized views,以及依工作負載進行查詢最佳化。

資料庫工程
收藏 0GitHub 156.1k
W
airflow-dag-patterns

作者 wshobson

airflow-dag-patterns 可協助設計可用於正式環境的 Apache Airflow DAG,提供更完善的任務模式、相依關係、operators、sensors、測試與排程工作部署指引。

定时任务
收藏 0GitHub 32.6k
W
dbt-transformation-patterns

作者 wshobson

dbt-transformation-patterns 可協助代理將 dbt 專案整理為 staging、intermediate 與 marts 分層,並涵蓋 testing、documentation 與 incremental model 的實務指引。適合用來評估是否安裝、建立新 repo 骨架,或將既有 SQL 重構為更清晰的 analytics engineering 模式,特別適用於 Database Engineering 團隊。

資料庫工程
收藏 0GitHub 32.6k
W
spark-optimization

作者 wshobson

spark-optimization 是一份實用指南,協助診斷執行緩慢的 Apache Spark 工作,重點涵蓋 partitioning、shuffle、skew、caching 與記憶體調校。你可以用它從 wshobson/agents 安裝此技能、閱讀 SKILL.md,並根據 Spark UI 徵兆、叢集設定與查詢模式,採取有憑有據的最佳化修正。

性能优化
收藏 0GitHub 32.6k
M
data-analytics

作者 markdown-viewer

data-analytics skill 會為資料分析工作流程產生 PlantUML 圖表,涵蓋 ETL、ELT、data lake、warehouse、streaming pipeline、log analytics 與 BI dashboard。它特別針對清楚的來源到目的地流程、AWS analytics/database stencil,以及實用的 data-analytics 指南式輸出而最佳化,不是用來畫一般軟體或雲端架構圖。

数据分析
收藏 0GitHub 1.1k
W
ml-pipeline-workflow

作者 wshobson

ml-pipeline-workflow 是一份實用指南,聚焦如何設計涵蓋資料準備、訓練、驗證、部署與監控的端到端 MLOps pipeline,並提供可重複執行的工作流程自動化編排模式。

工作流自動化
收藏 0GitHub 0
Data Pipelines