tag 數據倉庫

標籤
貢獻158
161
01:08 PM · Nov 03 ,2025

@數據倉庫 / 博客 RSS 訂閱

mb69410ac31213c - 華為雲Flexus AI智能體:讓企業智能化轉型“輕裝快跑”

當AI技術的浪潮席捲各行各業,“如何讓AI真正落地到業務場景”,成了無數企業的共同命題。有的企業困於技術門檻,有的卡在成本高企,有的愁於落地效率——而華為雲推出的Flexus AI智能體,正以“一站式平台”的姿態,把這些難題變成了“輕量級操作”。它不是冰冷的技術工具,更像一位懂業務的“智能夥伴”,讓企業從“AI圍觀者”變成“AI實踐者”。 從“技術門檻”到“零成本上手”:A

業務邏輯 , 大數據 , 數據倉庫 , 數據安全 , 官網

收藏 評論

一線數智 - AI 項目越做越亂?你缺的其實是新一代數據治理體系

【一線數智評論】最近在梳理客户標籤時發現,基於過去的大數據的客户標籤算法和管理方式,在今天有AI加持下,多模態的數據管理,存在缺失,AI時代,數據治理必須重做一遍   過去十幾年,企業對“數據治理”的理解大多停留在:建數據倉庫、做數據質量、統一指標口徑、管權限、查血緣。   這當然重要,但在 AI 浪潮面前,這套思維已經不夠用了。   因為今天企業面臨的是:

大數據 , 數據 , 數據倉庫 , 自動生成 , 模態

收藏 評論

事辯天下 - 數據驅動人力資源新生態:從“人才星球”啓航到“數紐中心”揭牌

數據要素正以前所未有的力量重塑產業格局,人力資源領域率先迎來關鍵突破。在短短兩天內,一場圍繞“數據驅動”的系列重磅活動在上海舉行,從民間生態的盛大啓航到官方平台的權威賦能,清晰勾勒出人力資源產業轉型升級的未來路徑,標誌着行業正式邁入“星聯數紐”的新紀元。 11月12日:生態聚變,“人才星球”啓航共創產業新生態 系列活動的序幕,於11月12日在上海張江V

大數據 , 數據 , 數據倉庫 , 解決方案 , 數據驅動

收藏 評論

向量檢索 - 如何通過HTTP API檢索Doc

本文介紹如何通過HTTP API在Collection中進行相似性檢索。 前提條件 已創建Cluster:創建Cluster。 已獲得API-KEY:API-KEY管理。 Method與URL HTTP POST https://{Endpoint}/v1/collections/

向量檢索 , 大數據 , yyds乾貨盤點 , 數據倉庫 , AI , 人工智能 , 大模型

收藏 評論

mob64ca14193248 - 大數據培訓hive數倉存儲格式詳解_hive一次能insert多少條

5.1.5 數據倉庫存儲格式選擇 選擇合適的存儲格式,需要在查詢性能、寫入性能、存儲成本、壓縮效率、模式演化支持、生態系統兼容性等多個維度進行權衡。現代數據倉庫(尤其是基於數據湖的架構)提供了多種列式存儲格式作為首選。 一、 核心存儲格式對比 以下是目前主流的、適用於數據倉庫場景的存儲格式:

大數據 , 數據 , hive , 數據倉庫 , 元數據 , 後端開發 , Python

收藏 評論

clghxq - dify進行嵌入式索引很慢

列表list 元素可以放各種類型,字符串,數字,bool元組,列表,字典,對象 列表是有序的,可以索引可以切片,跟字符串的索引和切片是一樣的操作 如果是取單個的元素,元素本身是什麼類型取出來就是什麼類型,如果是切片,取出來依然是列表 li = ['haha',123,[14,5,6],''] print(li[0]) print(li[1:4])

dify進行嵌入式索引很慢 , 大數據 , 字符串 , 數據倉庫 , 迭代 , for循環

收藏 評論

事辯天下 - 2025中國上海國際童書展圓滿落幕 全球兒童內容產業在滬呈現蓬勃活力

2025中國上海國際童書展(CCBF,以下簡稱上海童書展)於11月16日在上海世博展覽館圓滿落幕。本屆展會吸引了來自35個國家和地區的474家參展商亮相,集中展示超過2萬種中外最新童書。根據主辦方統計,截止稿件發佈,本屆展會促成近1000項版權交易意向,實現圖書銷售碼洋約1500萬元,文創和衍生品銷售額接近200萬元。 展會三天共迎來42,387名觀眾,其中包括15

商業 , 大數據 , ip , 數據倉庫 , 類圖

收藏 評論

程序猿追 - 基於亮數據MCP與AI的全球電商實時監控與動態定價實踐

https://www.bilibili.com/video/BV15xUCBNEzi/?vd_source=8c987e288018fae8f95831d231306b93 在全球電商的激烈競爭中,信息差就是利潤差。對手的一次悄然降價、一個突然出現的負面評價,或是一款熱門商品的斷貨,都可能讓您措手不及,導致訂單流失或庫存積壓。傳統的監控方式效率低

商業 , 大數據 , 監控方式 , 數據倉庫 , 解決方案

收藏 評論

建投數據 - 建投數據再度獲評國家級“高新技術企業”

近日,建投數據順利通過由北京市科學技術委員會、北京市財政局、國家税務總局北京市税務局聯合評審,再度獲評國家級“高新技術企業”。自2016年首度獲得該項資質以來,建投數據已連續第四次通過評審,持續保持國家高新技術企業資格。 國家高新技術企業認定,是在國家重點支持的高新技術領域內,對持續進行研究開發與技術成果轉化形成企業核心自主知識產權,並以此為基礎開展經營活動的企業的

大數據 , 數據倉庫 , 科研項目 , 研發管理 , 解決方案

收藏 評論

colddawn - 磁盤數據塊和磁盤索引塊什麼關係

  這幾天在學文件系統的移植,一大堆大小概念弄得我一臉懵逼,所以趕緊補了補基礎知識,別小看基礎知識,它可以在很大程度上幫助我們撩小姐姐(手動狗頭) 以下解釋出自百度百科:   扇區是磁盤最小的物理存儲單元,但由於操作系統無法對數目眾多的扇區進行尋址,所以操作系統就將相鄰的扇區組合在一起,形成一個簇,然後再對簇進行管理。每個簇可以包括2、4、8、16、32或

大數據 , 文件系統 , 讀取數據 , 磁盤控制器 , 數據倉庫 , 磁盤數據塊和磁盤索引塊什麼關係

收藏 評論

南大通用GBase - 南大通用GBase 8a堆棧收集方式彙總

集羣在運行過程中偶爾會出現crash,當集羣crash時,從哪裏查看堆棧信息呢?system.log 中記錄了宕機的堆棧信息,core 文件中記錄了宕機的詳細的堆棧信息,如果想要看到詳細的堆棧信息,則需要在集羣coor節點以及集羣data節點的配置文件中,開啓該功能,具體步驟如下: 1、修改集羣coor節點配置文件:在每台集羣coor節點機器的集羣安裝目錄,如/opt/gc

sed , GBase 8a , 大數據 , 配置文件 , 數據倉庫 , 堆棧

收藏 評論

mob64ca14068b0b - 限積天EDADB2

本文包含:--> --> 本文章為轉載內容,我們尊重原作者對文章享有的著作權。如有內容錯誤或侵權問題,歡迎原作者聯繫我們進行內容更正或刪除文章。

限積天EDADB2 , 大數據 , 數據倉庫 , 定積分

收藏 評論

ApacheSeaTunnel - (四)收官篇!從分層架構到數據湖倉架構系列:數據服務層和數據應用層及湖倉技術趨勢小結

《新興數據湖倉設計與實踐手冊·從分層架構到數據湖倉架構設計(2025 年)》 系列文章將聚焦從數據倉庫分層到數據湖倉架構的設計與實踐。手冊將闡述數據倉庫分層的核心價值、常見分層類型,詳解分層下的 ETL 架構及數據轉換環節,介紹數據倉庫分層對應的技術架構,並以貼源層(ODS)、數據倉庫層(DW)、數據服務層(DWS)為例,深入剖析數湖倉分層設計,最後探討數據倉庫技術趨勢並進行小結。

spark , WhaleStudio , 大數據 , 數據倉庫 , 數據庫 , 白鯨開源

收藏 評論

網絡安全俠 - pdb2gmx和gaff的區別

---恢復內容開始--- 1.1 電路原理圖         S1-S5共5個按鍵,其中,S2-S4為中斷按鍵,S1為復位按鍵。S1直接為硬件復位電路,並不需要我們寫進驅動。   單片機接口如下圖:               由圖中可以看出,EIN

大數據 , pdb2gmx和gaff的區別 , include , 數據倉庫 , 引腳 , define

收藏 評論

killads - 數據湖為什麼比hive快

導讀: 大數據技術的發展歷程中,繼數據倉庫、數據湖之後,大數據平台的又一革新技術——湖倉一體近年來開始引起業內關注。市場發展催生的數據管理需求一直是數據技術革新的動力。比如數據倉庫如何存儲不同結構的數據?數據湖又如何避免因為缺乏治理導致的數據雜亂現象?今天的文章想跟大傢俱體聊聊我們的數棧如何解決這些問題。 你能看到👇👇👇 ▫ 湖倉一體概念簡述 ▫ 數

數據源 , 大數據 , 數據 , hive , 數據倉庫 , 數據湖為什麼比hive快

收藏 評論

夢想啓航吧 - 二級間接索引示意圖

#define _CRT_SECURE_NO_WARNINGS 1 //樹:非線性的數據結構,由有限個節點組成一個具有層次關係的集合。像是一顆倒掛的樹,所以叫樹。 //樹的相關概念: //1、節點的度:一個節點含有的子樹的個數成為節點的度 //2、葉節點(終端節點):度為0的節點稱為終端節點,(子節點為空的節點) //3、非終端節點(分支節點):度不為0的節點,即(

二級間接索引示意圖 , 大數據 , 數據倉庫 , 二叉樹 , 子樹 , 子節點

收藏 評論

lingyuli - 多索引組合值不可以唯一嘛

長期以來,Lucene在搜索領域的壟斷地位無人能及,基於Lucene之上的Elastic Search與Solr 也是家喻户曉的產品;錄信數據庫最初的版本也是基於Lucene來實現的,在設計之初經常會遇到跟solr、es同樣的問題。如面對幾十億的數據就遇到內存爆掉的問題,此時CPU與IO都飆到系統極限;100億的數據就需要100多台512G的大內

lucene , 大數據 , 索引 , 數據倉庫 , 數據庫 , olap , 多索引組合值不可以唯一嘛

收藏 評論

小題大作 - VMFS索引

什麼是索引 索引時數據庫的一種數據結構,數據庫與索引的關係可以看作書籍和目錄的關係。當用户通過索引查找數據時,好比用户通過目錄查詢某章節的某個知識點。這樣可以幫助用户提高查找速度。所以,索引可以提高數據庫的性能。 索引的分類 從物理存儲角度: 聚簇索引和非聚簇索引 從數據結構角度: B-樹、B+

結點 , 大數據 , 數據 , VMFS索引 , 數據倉庫 , 數據庫

收藏 評論

阿里雲大數據AI技術 - 【跨國數倉遷移最佳實踐11】基於 MaxCompute Resource & Quota策略優化實現資源管理性能與成本最優平衡

本系列文章將圍繞東南亞頭部科技集團的真實遷移歷程展開,逐步拆解 BigQuery 遷移至 MaxCompute 過程中的關鍵挑戰與技術創新。本篇為第十一篇,基於 MaxCompute Resource Quota 策略優化實現資源管理性能與成本最優平衡。 注:客户背景為東南亞頭部科技集團,文中用 GoTerra 表示。 1. 背景 GoTerra 作為東南亞互

MaxCompute , 大數據 , 數據倉庫 , 阿里雲 , 數倉遷移

收藏 評論

署署愛測評 - 企業數據採集系統的構建思路與技術方案探討

在數字化轉型過程中,企業普遍面臨數據源分散、格式不一、實時性要求高等挑戰。數據採集作為數據價值鏈的起點,其技術選型與架構設計直接影響後續數據治理與應用的效率與成本。本文旨在從技術原理與工程實踐角度,分析構建企業級數據採集系統時需考量的核心要素與可能的實現路徑。 一、數據採集的核心挑戰與技術考量數據採集並非簡單的數據搬運,其複雜性主要源於業務環境的多樣性。常見挑戰包括:

數據源 , 大數據 , 數據 , 運維 , 數據倉庫

收藏 評論

mob64ca13feda16 - simulink索引模塊

Simulink是有定點化工具(fixed-point tool),沒有用過,因為我想生成一個不帶有浮點數的代碼的話只要把所有的數據類型定義為非浮點的形式就好了。 首先 要做的是找到模型中的浮點數(當然如果建模的時候沒有對數據類型進行特別設置的話,默認的數據類型都是double型的浮點數)。找浮點數有兩個方法:

定點化 , 數據類型 , 大數據 , Simulink , 數據倉庫 , simulink索引模塊

收藏 評論

亞拉索第一 - 聚焦行業價值與生態演進:一個開發者眼中的技術躍遷

引言 作為一名深耕行業十年的開發者,我親歷了從傳統瀑布式開發到敏捷迭代的轉型,也見證了AI技術從實驗室走向產業落地的全過程。當對話式AI成為生產力工具的核心入口時,我們不再只是代碼的寫作者,更是人機交互範式的構建者。華為雲推出的MateChat作為面向AIGC場景的對話組件庫,正以務實的技術底座推動行業價值的釋放。以下是我基於實戰經驗,對大模型適配

人機交互 , 大數據 , 數據倉庫 , 開發者 , 模態

收藏 評論

向量檢索 - 如何通過HTTP API獲取Doc

本文介紹如何通過HTTP API,根據id列表獲取Collection中已存在的Doc。 説明 如果指定id不存在,則該id對應的Doc為空。 前提條件 已創建Cluster:創建Cluster。 已獲得API-KEY:API-KEY管理。 Method與URL HTTP

大數據 , yyds乾貨盤點 , 數據倉庫 , 向量 , AI , 數據庫 , 大模型

收藏 評論

代碼匠人之心 - 在文本類型上設置索引 會生效麼

在建立索引前,先了解下lucene中的一些與索引相關的重要類。 為了對文檔進行索引,Lucene 提供了五個基礎的類,他們分別是 Document, Field, IndexWriter, Analyzer, Directory。下面我們分別介紹一下這五個類的用途: Document Document 是用來描述文檔的,這裏的文檔可以指

在文本類型上設置索引 會生效麼 , System , 大數據 , 數據倉庫 , text , HTML

收藏 評論