@hive

動態 列表
@chunzhendegaoshan

SQL Server到Hive:批處理ETL性能提升30%的實戰經驗

在企業數字化轉型進程中,將 SQL Server 的業務數據同步至 Hive 數據倉庫,是構建大數據分析平台的關鍵一步。然而,當數據量突破千萬級門檻,傳統同步方式往往陷入效率低下、穩定性差的困境。本文將分享使用ETLCLoud工具實現千萬級數據量下SQL Server到Hive高效同步的實戰經驗。 1.配置數據源 來到平台首頁進入數據源管理模塊。 在新建數據源中選擇SQLserver數據源模板

chunzhendegaoshan 頭像

@chunzhendegaoshan

昵稱 RestCloud

@mirrorship

如何理解 Apache Iceberg 與湖倉一體(Lakehouse)?

一、什麼是湖倉一體(Lakehouse)? 湖倉一體是一種融合了數據湖的靈活存儲能力與數據倉庫的高效分析功能的現代數據架構。它通過整合兩者的優勢,解決了傳統架構的侷限性,為企業數據處理提供了更全面的解決方案。 數據湖的開放性:支持多格式數據存儲(如 Parquet、ORC),兼容開放生態(如Hive、Iceberg),存儲成本低。 數據倉庫的高性能:提供 ACID 事務、高效查詢和實時分析能

mirrorship 頭像

@mirrorship

昵稱 鏡舟科技

@doge_king

悶聲發大財,Spark&HiveSQL神器大更新

本文在綠泡泡“狗哥瑣話”首發於2025.9.23 -關注不走丟。 大家好這裏是狗哥。在23年11月,我向大家安利我自己寫的SparkHiveSQL VsCode插件,當時主要是這麼幾個功能: 語法檢測功能 format 重構 代碼補全 發現引用 時隔兩年,這個插件其實一直在迭代中。接下來我就向大家介紹一下後續迭代的新功能。 最值得一提的功能:SparkSQL語義檢測 眾所周知,在使用

doge_king 頭像

@doge_king

昵稱 泊浮目