Iceberg是Netflix開發的面向海量數據分析場景的數據組織形式,在眾多數據湖技術中獨樹一幟,目前已晉升Apache頂級項目,是各大互聯網公司的首選數據湖技術,騰訊即選擇了Iceberg作為數據湖存儲引擎。
本套教程由尚硅谷聯合Iceberg開發團隊共同推出。從Iceberg的技術特點和存儲結構入手展開講解,詳細介紹了與大數據主流框架的集成與使用,包括Hive、Spark SQL、Flink SQL、Flink DataStream,從簡單的安裝配置,到詳細的日常操作,再到解決集成中的各種問題,實用更實戰!
教程延續了尚硅谷一貫的風格:保姆式講解,敗家式贈送。課程由淺入深,從理論到實操涵蓋全面,手把手教學,視頻、代碼、筆記、資料,一股腦全部送送送!
教程目錄
01.Iceberg教程簡介
02.Iceberg簡介_概述
03.Iceberg簡介_特性
04.Iceberg簡介_其他數據湖框架的對比
05.Iceberg存儲結構_基本概念
06.Iceberg存儲結構_查詢流程分析
07.Iceberg與Hive集成_版本對應關系
08.Iceberg與Hive集成_環境準備
09.Iceberg與HIve集成_Catalog說明
10.Iceberg與Hive集成_使用默認Catalog
11.Iceberg與Hive集成_指定Catalog演示
12.Iceberg與Hive集成_指定路徑加載表
13.Iceberg與Hive集成_創建表
14.Iceberg與Hive集成_修改&插入&刪除
15.Iceberg與SparkSQL集成_環境準備
16.Iceberg與SparkSQL集成_創建Catalog
17.Iceberg與SparkSQL集成 _創建分區表&隱藏分區
18.Iceberg與SparkSQL集成_使用CTAS和REPLACE建表
19.Iceberg與SparkSQL集成_刪除表
20.Iceberg與SparkSQL集成_修改表
21.Iceberg與SparkSQL集成_添加列
22.Iceberg與SparkSQL集成_修改和刪除列
23.Iceberg與SparkSQL集成_修改分區
24.Iceberg與SparkSQL集成_插入MERGE INTO&查詢元數據
25.Iceberg與SparkSQL集成_存儲過程調用
26.Iceberg與DF API集成_環境準備
27.Iceberg與DF API集成_讀取表
28.Iceberg與DF API集成_檢查表
29.Iceberg與DF API集成_寫入表
30.Iceberg與DF API集成_維護表 _獲取Table對象
31.Iceberg與DF API集成_維護表_快照過期清理
32.Iceberg與DF API集成_維護表_清理無效文件&合并小文件
33.Iceberg與FlinkSQL集成_環境準備
34.Iceberg與FLinkSQL集成_創建Catalog
35.Iceberg與FlinkSQL集成_建表及限制
36.Iceberg與FlinkSQL集成_修改表和刪除表
37.Iceberg與FlinkSQL集成 _插入表&upsert問題分析
38.Iceberg與FlinkSQL集成 _流式鏈路問題分析對比
39.Iceberg與FlinkSQL集成_與Flink集成的不足
40.Iceberg與Flink DataStream集成_環境準備
41.Iceberg與Flink DataStream集成_讀取數據
42.Iceberg與Flink DataStream集成_FLIP-27方式讀取
43.Iceberg與Flink DataStream集成寫入數據
44.Iceberg與Flink DataStream集成 _合并文件&元數據管理API
上一篇: 前端培訓班出來能找到工作嗎
已是最新文章