Data Pipelines

Data Pipelines taxonomy generated by the site skill importer.

3 个技能
W
spark-optimization

作者 wshobson

spark-optimization 是一份实用指南,帮助诊断运行缓慢的 Apache Spark 作业,重点覆盖 partitioning、shuffle、skew、caching 和 memory tuning。你可以用它从 wshobson/agents 安装该 skill,阅读 SKILL.md,并结合 Spark UI 症状、集群配置与查询模式,采用有依据的优化方案。

性能优化
收藏 0GitHub 32.6k
W
dbt-transformation-patterns

作者 wshobson

dbt-transformation-patterns 可帮助智能体按 staging、intermediate 和 marts 分层来组织 dbt 项目,并提供测试、文档和增量模型实践指导。适合用于安装前评估、搭建新 repo,或将 SQL 重构为更清晰的 analytics engineering 模式,尤其适合 Database Engineering 团队参考。

数据库工程
收藏 0GitHub 32.6k
W
airflow-dag-patterns

作者 wshobson

airflow-dag-patterns 可帮助你设计可用于生产环境的 Apache Airflow DAG,提供更完善的任务模式、依赖关系、operators、sensors、测试与定时作业部署指导。

定时任务
收藏 0GitHub 32.6k