博客 / 列表

數據集成與治理 - 一文教你讀懂數據架構

我發現很多企業做數字化,都遇到過這些問題: 上了ERP、MES、SCADA等系統,但數據互不聯通; 想做個生產分析,發現數據在ERP裏,質量數據在MES裏,設備數據又在另一個系統; 領導想看實時生產情況,IT部門卻要花好幾天整理數據。 但説到底,我們不是沒有數據,而是缺少一套能夠打通數據、真正服務業務的數據架構。 一、先搞清楚什麼是數據架構 一提到“架構”,有人覺得是 IT 部門的“技術

數據結構 , 架構設計

數據集成與治理 - 不懂湖倉一體,別説你懂大數據

√不懂湖倉一體,別説你懂大數據 接觸數據的都聽過“湖倉一體”,有人就開始疑惑了:數據湖和數據倉庫不是夠用嗎?為什麼還要多餘再搞一個架構出來? 實際上,你接觸到的數據有:像客户信息、生產日誌和客服錄音等。它們的類型是不統一的,什麼結構化、半結構化甚至非結構化,很多時候它們常因為這個原因導致不能存放在一塊,也不能通用。 怎麼辦? 所以這時候就得靠搭建一個湖倉一體,把這些數據都存好,管好,目的就是為了輕

大數據 , 數據倉庫 , 數據可視化 , 數據庫

數據集成與治理 - 一文講清數據要素,數據資產,數據治理和數字資產

我前些年在做數據支持的時候,每到開會時總會聽到: 業務部門説盤活數據資產,技術團隊卻在強調必須先做好數據治理; 管理層要求要釋放數據價值,財務部門卻在質疑:這些數據投入到底能帶來多少實際收益? 更麻煩的是,不同團隊對同一個數據指標的理解各不相同,導致報表數據對不上,會議時間都浪費在基礎概念的爭論上。 這些問題,其實就是沒把數據要素、數據資產、數據治理和數字資產幾個核心概念理清楚。 接下來,

大數據 , 教程 , 數據可視化 , 知識 , 數據庫

數據集成與治理 - 信息化≠數字化,盤點二者的主要區別

最近總會有一些做IT行業的朋友來問:信息化和數字化兩個有什麼區別?不都是利用數據做決策嗎? 但其實,這兩者還是有很大的區別的。 用過來人的經驗告訴你,怎麼區分關鍵在於理解它們解決問題的不同層次。就拿我們最熟悉的報銷流程來説: 以前需要填寫紙質單據,找領導簽字,送到財務部等待支付;現在在辦公系統裏提交電子報銷單,在線審批後直接打款到銀行卡。 你可能會覺得這已經很先進了,但我想説,這僅僅是信息化的範疇

算法 , 知識 , 數據庫 , 後端 , 前端

數據集成與治理 - 為什麼總有人説低代碼不行?

我接觸IT領域這麼多年,我太知道IT部門每天要煩惱的問題了: 業務部門急着要一個數據報表系統,IT部門説至少等三個月; 公司想優化辦公流程,報價卻要大幾十萬起步,結果好不容易系統上線了,業務規則一變,又要重新開發,費時費力。 這背後,其實是三個困擾無數企業的核心問題:IT資源永遠不夠用、開發成本居高不下、業務需求變化太快。 這些問題,正是“低代碼”技術要解決的核心。

it , 低代碼 , 開發 , 後端 , 前端

數據集成與治理 - 什麼是技術架構、數據架構、業務架構、應用架構、產品架構和項目架構?

為什麼明明做好了技術設計,項目推進卻依然困難重重? 技術團隊開發的功能業務方總説不適用;系統隨着業務發展變得臃腫難維護;跨部門協作時各説各話,推進困難。 這些問題看似毫無關聯,但它們都指向同一個根源:對架構認知的片面與缺失。 有了對架構的認知,各部門之間就有了對項目可行性的推測計算,這大大減少了資源的浪費,同時還能加強各部門之間的交流合作。 今天,我就來系統梳理六大核心架構

技術架構 , 架構 , 產品 , 後端 , 前端

數據集成與治理 - 終於有人把數據傾斜講清楚了

我幹大數據這麼多年,見過太多人被數據傾斜折騰得沒脾氣—— 明明數據量不算特別大,任務卻死活跑不完; 明明集羣資源還夠,節點卻接二連三OOM。 其實不是你技術不行,而是沒把數據傾斜的底層邏輯搞明白。 今天這篇文章,我不整那些虛的,就用最實在的話、最真實的踩坑經歷,帶你從現象到本質,把數據傾斜的解決辦法摸透。 一、數據傾斜的本質是什麼 很多人一遇到數據傾斜,就覺得是“數據太多了”,其實完全錯了

大數據處理

數據集成與治理 - 流處理 or 批處理?大數據架構還需要流批一體嗎?

流處理(​處理實時數據流​)和批處理(​處理歷史數據集​),曾經是支撐我們實時監控和深度分析的兩大支柱。 但日子久了,​問題也來了:​它們數據不通、代碼不通、資源不通。 為了同時滿足“秒級響應”和“深度分析”,不得不同時維護兩套系統、寫兩套代碼、存兩份數據。成本高、效率低,還容易出錯。 如今,業務對數據的要求越來越高: 報表要從“T+1”變成“分鐘級”, 實時數據要立刻用於模型訓練,

大數據處理