數據倉庫在整個大數據體系中的重要性不言而喻,是入行大數據的敲門磚,是整個大數據體系的基石。尚硅谷經典之作再次重大升級,離線數倉5.0項目攜四大升級震撼來襲!
升級一:全面修改業務數據采集系統!引入實時業務數據采集技術Maxwell和Canal,使用DataX替換Sqoop,實時監測業務數據庫變動情況,舍棄原有每天一同步的思路,數據采集更全面、更準確、更流暢!
升級二:數倉建模理論更豐富全面!基于數倉建模大神Bill Inmon和Ralph Kimball的經典建模理論,結合阿里巴巴成熟的數倉構建實踐,梳理出通用的數倉建模步驟,精簡數倉建模體系,新增指標體系構建過程,升級了一套更具權威性且實操性更強的數倉建模理論體系。
升級三:更換為更易用、更前沿、更受歡迎的任務流調度系統DolphinScheduler,不再需要單獨編寫任務流配置文件,真正做到拆箱即用!
升級四:數倉整體表格數量大幅增加!完善需求場景,增加主題域和業務過程,更貼近企業實戰,數倉更大更完善!
通過本套視頻教程的學習,你可以掌握數倉建模的各種理論知識,從零開始搭建一套離線數倉系統,掌握主流的大數據相關技術,對數倉的整體構架有一個完整的認識。教程的數倉項目與企業真實項目無縫對接,實現需求的思路可直接嫁接至現實工作中,可以為你在大數據開發過程中遇到難題提供更多的解決問題思路。
本套教程適合具備一定大數據技術基礎的人群學習,至少掌握SQL的寫法、Linux的基本用法,對Hadoop生態的基礎框架有一定了解。
上一篇:
尚硅谷ShardingSphere新版視頻教程發布
下一篇:
唯快不破 | 尚硅谷Java入門極速版教程發布