數據管道通過整合、清理、分析、可視化等方式來管理初始收集的數據流。Apache Airflow提供了一個統(tǒng)一的平臺,可以使用它設計、實施、監(jiān)控和維護數據的流動。Airflow具有易于使用的UI、即插即用的選項以及靈活的Python腳本,這些都使Airflow能夠非常輕松地完成任何數據管理任務?!≡凇禔pache Airflow 數據編排實戰(zhàn)》中,介紹了如何構建和維護有效的數據管道。與你一同探索最常見的使用模式,包括聚合多個數據源、連接到數據湖以及云端部署??梢詫⒈緯鳛锳irflow的實用指南,本書涵蓋了為Airflow提供動力的有向無環(huán)圖(DAG)的各方面知識,以及如何根據工作需求對其進行自定義的技術。 主要內容 ● 構建、測試及部署Airflow管道作為DAG ● 自動對數據進行移動和轉換 ● 使用回填技術分析歷史數據集 ● 開發(fā)自定義組件 ● 在生產環(huán)境中搭建Airflow