tag 大數據

標籤
貢獻385
322
05:15 PM · Oct 25 ,2025

@大數據 / 博客 RSS 訂閱

阿森CTO - Linux多線程

@TOC 📝進程和線程 進程是資源分配的基本單位 線程是調度的基本單位 線程共享進程數據,但也擁有⾃⼰的⼀部分數據: 線程ID 一組寄存器 棧 errno 信號屏蔽字 調度優先級 🌠 進程的多個線程共享 同⼀地址空間,因此TextSegment、DataS

全局變量 , 大數據 , yyds乾貨盤點 , include , 數據倉庫 , i++

收藏 評論

mb69410ac31213c - 華為雲Flexus AI智能體:讓企業智能化轉型“輕裝快跑”

當AI技術的浪潮席捲各行各業,“如何讓AI真正落地到業務場景”,成了無數企業的共同命題。有的企業困於技術門檻,有的卡在成本高企,有的愁於落地效率——而華為雲推出的Flexus AI智能體,正以“一站式平台”的姿態,把這些難題變成了“輕量級操作”。它不是冰冷的技術工具,更像一位懂業務的“智能夥伴”,讓企業從“AI圍觀者”變成“AI實踐者”。 從“技術門檻”到“零成本上手”:A

業務邏輯 , 大數據 , 數據倉庫 , 數據安全 , 官網

收藏 評論

代碼匠心 - Lambda架構:實時與批處理的完美融合

引言 在當今數據爆炸的時代,企業面臨着前所未有的數據處理挑戰——如何同時滿足海量歷史數據的批處理分析需求和實時數據的低延遲查詢需求?2014年,Storm的作者Nathan Marz提出了一種革命性的架構模式——Lambda架構,為解決這一矛盾提供了優雅的解決方案。 Lambda架構通過巧妙地將數據處理分解為批處理層(Batch Layer)、加速層(Speed Layer)和服務層(Servin

大數據處理 , 大數據 , hadoop , flink

收藏 評論

qbit - 面向學科領域的網絡信息資源深度聚合與服務研究——Part2(qbit學習記錄)

圖書信息 《面向學科領域的網絡信息資源深度聚合與服務研究》 項目背景 本書是國家社科基金重大項目“面向學科領域的網絡信息資源深度聚合與服務研究”的結項成果, 孫建軍教授是該項目的首席專家。 回目錄 第二部分 學術網絡資源特徵及利用 2 學術網絡資源特徵、分步及模式 2.1 資源類型及分佈 2.1.1 學術數據庫 2.1.2 電子期刊 2.1.3 電子圖書 2.1.4 網絡學

大數據

收藏 評論

一線數智 - AI 項目越做越亂?你缺的其實是新一代數據治理體系

【一線數智評論】最近在梳理客户標籤時發現,基於過去的大數據的客户標籤算法和管理方式,在今天有AI加持下,多模態的數據管理,存在缺失,AI時代,數據治理必須重做一遍   過去十幾年,企業對“數據治理”的理解大多停留在:建數據倉庫、做數據質量、統一指標口徑、管權限、查血緣。   這當然重要,但在 AI 浪潮面前,這套思維已經不夠用了。   因為今天企業面臨的是:

大數據 , 數據 , 數據倉庫 , 自動生成 , 模態

收藏 評論

青雲交技術圈 - Java 大視界 -- Java 大數據在智能物流運輸車輛智能調度與路徑優化中的技術實現

(centerJava 大視界 -- Java 大數據在智能物流運輸車輛智能調度與路徑優化中的技術實現/center) 引言: 嘿,親愛的 Java 和 大數據愛好者們,大家好!我是CSDN(全區域)四榜榜首青雲交!對在《大數據新視界》和《 Java 大視界》專欄攜手探索的旅程中,我們已共同見證 Java 大數據在諸多領域掀起的技術變革。從電商用户流失預測的精準洞察,到城市空氣質

spark , List , 大數據 , yyds乾貨盤點 , Java大數據 , JAVA

收藏 評論

合合技術團隊 - 用户的聲音 | 文檔結構化信息提取方案測評:LLM、開源模型部署與雲端API,誰是合適選擇?

文檔預處理之文本化 近日,我們收到來自專業用户的使用心得,通過測試淺析結構化信息提取技術,輔助完成技術選型。結構化信息提取的重要性數據作為大模型時代的核心生產資料,其結構化處理能力直接影響AI系統的實用價值。 結構化信息提取的重要性 數據作為大模型時代的核心生產資料,其結構化處理能力直接影響AI系統的實用價值。儘管知識圖譜、RAG等技術依賴海量文本資源,但現實中的歷史檔案、法律文書等重要數據多以掃

llm , 大數據 , 人工智能 , 文檔

收藏 評論

事辯天下 - 數據驅動人力資源新生態:從“人才星球”啓航到“數紐中心”揭牌

數據要素正以前所未有的力量重塑產業格局,人力資源領域率先迎來關鍵突破。在短短兩天內,一場圍繞“數據驅動”的系列重磅活動在上海舉行,從民間生態的盛大啓航到官方平台的權威賦能,清晰勾勒出人力資源產業轉型升級的未來路徑,標誌着行業正式邁入“星聯數紐”的新紀元。 11月12日:生態聚變,“人才星球”啓航共創產業新生態 系列活動的序幕,於11月12日在上海張江V

大數據 , 數據 , 數據倉庫 , 解決方案 , 數據驅動

收藏 評論

wx5d7321c78b265 - php怎麼安裝_PHP環境搭建的詳細步驟與注意事項

PHP環境搭建主要有集成環境、手動配置和容器化三種方案。集成環境(如XAMPP)安裝簡便,適合新手快速上手,但靈活性差;手動配置(如Ubuntu下用apt安裝Apache、PHP、MySQL)可控性強,適合生產環境,但複雜度高;容器化(如Docker)兼具隔離性與一致性,利於團隊協作和部署,但資源消耗大且學習成本高。關鍵配置包括php.ini中的時區、內存限制、文件上傳

大數據 , php , hive , apache

收藏 評論

青雲交技術圈 - Java 大視界 -- Java 大數據機器學習模型在自然語言生成中的可控性研究與應用實戰

(centerJava 大視界 -- Java 大數據機器學習模型在自然語言生成中的可控性研究與應用實戰/center) 引言: 嘿,親愛的 Java 和 大數據愛好者們,大家好!我是CSDN(全區域)四榜榜首青雲交!自然語言生成(NLG)技術正掀起人工智能領域的新一輪變革 —— 從智能客服自動應答,到新聞稿件批量生成,NLG 已深入內容生產、智能交互的每個角落。但當我們嘗試讓機

spark , 大數據 , yyds乾貨盤點 , Java大數據 , JAVA

收藏 評論

clougence - 用一條表達式,穩定同步上萬張表

在現代業務環境中,“表太多” 已成為數據庫同步領域越來越普遍的現象。一個成熟的業務背後,數據庫中經常有幾千張甚至上萬張表。在這種規模下,一旦某張表未被同步,下游數倉和分析鏈路就可能出現斷層。 在這樣的背景下,如何實現海量表穩定、可擴展的數據遷移同步,成為一個亟待解決的問題。本文將圍繞這一挑戰展開分析,並分享一種新的解決思路 —— 基於表達式的表名匹配機制。 上萬張表同步,難在哪裏? 多表同步的挑戰

數據同步 , 大數據 , MySQL

收藏 評論

mob64ca1403c772 - vm archive擴容

個人理解 網上大多數擴容教程都是針對Centos系統。對於Ubuntu系統,系統擴容同樣用到LVM,但是如果Ubuntu一開始不是使用LVM管理的,之後有想要擴容,我沒有找到方法。 簡單説説對於系統擴容的理解吧。有2種情況,一種是隻需要擴充目前linux系統的硬盤容量,對於掛載的目錄沒有要求;另一種是隻想擴大根目錄的容量,這時候就

大數據 , 文件系統 , hive , vm archive擴容 , .net , ide

收藏 評論

向量檢索 - 如何通過HTTP API檢索Doc

本文介紹如何通過HTTP API在Collection中進行相似性檢索。 前提條件 已創建Cluster:創建Cluster。 已獲得API-KEY:API-KEY管理。 Method與URL HTTP POST https://{Endpoint}/v1/collections/

向量檢索 , 大數據 , yyds乾貨盤點 , 數據倉庫 , AI , 人工智能 , 大模型

收藏 評論

數據分析家 - MySql技術棧

一、引言:MyEMS 的定位與價值背景 在 “雙碳” 目標與工業精細化管理需求驅動下,能源管理系統(EMS)已成為企業降本增效、綠色轉型的核心工具。MyEMS(My Energy Management System)作為開源化、可定製的能源管理解決方案,憑藉模塊化架構與全流程技術覆蓋能力,實現從能源數據 “採、傳、存、算、用” 的閉環管理。其核心價

能源 , 大數據 , 信息可視化 , 架構 , 人工智能 , Css , 前端開發 , HTML

收藏 評論

百度Geek説 - 用增結算數倉化改造:在/離線調度系統的構建與應用

導讀 移動運營推廣平台(OPS)承載着百度內部移動應用/移動搜索業務的用户增長預算的全流程結算線上化管控功能,為了解決用增業務發展規模擴大、原有技術架構老舊、無離線數倉系統等一系列的問題,針對全域結算數據啓動了整體的架構改造。為了解決業務中存在的問題,本文深入探討並提出了一類在線、離線結合的任務調度解決方案,完成了結算業務架構更新換代,更好地服務於業務發展。 01 背景簡述 1.1業務/技術背景

大數據 , 架構 , 百度 , 重構

收藏 評論

mob64ca14193248 - 大數據培訓hive數倉存儲格式詳解_hive一次能insert多少條

5.1.5 數據倉庫存儲格式選擇 選擇合適的存儲格式,需要在查詢性能、寫入性能、存儲成本、壓縮效率、模式演化支持、生態系統兼容性等多個維度進行權衡。現代數據倉庫(尤其是基於數據湖的架構)提供了多種列式存儲格式作為首選。 一、 核心存儲格式對比 以下是目前主流的、適用於數據倉庫場景的存儲格式:

大數據 , 數據 , hive , 數據倉庫 , 元數據 , 後端開發 , Python

收藏 評論

clghxq - dify進行嵌入式索引很慢

列表list 元素可以放各種類型,字符串,數字,bool元組,列表,字典,對象 列表是有序的,可以索引可以切片,跟字符串的索引和切片是一樣的操作 如果是取單個的元素,元素本身是什麼類型取出來就是什麼類型,如果是切片,取出來依然是列表 li = ['haha',123,[14,5,6],''] print(li[0]) print(li[1:4])

dify進行嵌入式索引很慢 , 大數據 , 字符串 , 數據倉庫 , 迭代 , for循環

收藏 評論

事辯天下 - 2025中國上海國際童書展圓滿落幕 全球兒童內容產業在滬呈現蓬勃活力

2025中國上海國際童書展(CCBF,以下簡稱上海童書展)於11月16日在上海世博展覽館圓滿落幕。本屆展會吸引了來自35個國家和地區的474家參展商亮相,集中展示超過2萬種中外最新童書。根據主辦方統計,截止稿件發佈,本屆展會促成近1000項版權交易意向,實現圖書銷售碼洋約1500萬元,文創和衍生品銷售額接近200萬元。 展會三天共迎來42,387名觀眾,其中包括15

商業 , 大數據 , ip , 數據倉庫 , 類圖

收藏 評論

程序猿追 - 基於亮數據MCP與AI的全球電商實時監控與動態定價實踐

https://www.bilibili.com/video/BV15xUCBNEzi/?vd_source=8c987e288018fae8f95831d231306b93 在全球電商的激烈競爭中,信息差就是利潤差。對手的一次悄然降價、一個突然出現的負面評價,或是一款熱門商品的斷貨,都可能讓您措手不及,導致訂單流失或庫存積壓。傳統的監控方式效率低

商業 , 大數據 , 監控方式 , 數據倉庫 , 解決方案

收藏 評論

建投數據 - 建投數據再度獲評國家級“高新技術企業”

近日,建投數據順利通過由北京市科學技術委員會、北京市財政局、國家税務總局北京市税務局聯合評審,再度獲評國家級“高新技術企業”。自2016年首度獲得該項資質以來,建投數據已連續第四次通過評審,持續保持國家高新技術企業資格。 國家高新技術企業認定,是在國家重點支持的高新技術領域內,對持續進行研究開發與技術成果轉化形成企業核心自主知識產權,並以此為基礎開展經營活動的企業的

大數據 , 數據倉庫 , 科研項目 , 研發管理 , 解決方案

收藏 評論

墨韻流香 - 2019 亞馬遜關鍵詞優化規則A9算法的九個關鍵要素

當搜索規則的重構遇上流量分配的洗牌,亞馬遜賣家正面臨新一輪的生存考驗 2025年10月,亞馬遜搜索機制迎來重大調整,兩大核心變化正在重塑平台的流量分配邏輯,關鍵詞權重體系的重新洗牌與"多變體自然位"現象的出現,標誌着亞馬遜搜索算法進入新的發展階段,對於數百萬賣家而言,這既是一場嚴峻的挑戰,也是重新思考運營策略的契機。 關鍵詞權重重構:標題的王

產品運營 , 大數據 , 跨境電商 , 後端開發 , 電商 , 人工智能 , Python

收藏 評論

colddawn - 磁盤數據塊和磁盤索引塊什麼關係

  這幾天在學文件系統的移植,一大堆大小概念弄得我一臉懵逼,所以趕緊補了補基礎知識,別小看基礎知識,它可以在很大程度上幫助我們撩小姐姐(手動狗頭) 以下解釋出自百度百科:   扇區是磁盤最小的物理存儲單元,但由於操作系統無法對數目眾多的扇區進行尋址,所以操作系統就將相鄰的扇區組合在一起,形成一個簇,然後再對簇進行管理。每個簇可以包括2、4、8、16、32或

大數據 , 文件系統 , 讀取數據 , 磁盤控制器 , 數據倉庫 , 磁盤數據塊和磁盤索引塊什麼關係

收藏 評論

我就是不長肉而已 - BAT54C-ASEMI可直接替代安世BAT54C

編輯:ll BAT54C-ASEMI可直接替代安世BAT54C ASEMI首芯半導體可替代安氏半導體功率器件 型號:BAT54C 品牌:ASEMI 封裝:SOT-23 特性:肖特基二極管 正向電流:0.2A 反向耐壓:30V 恢復時間:35ns 引腳數量:2 芯片個數:1 芯片尺寸:MIL 浪涌電流:1

ASEMI , 大數據 , BAT54C , hadoop , 在51CTO的第一篇博文 , 肖特基二極管

收藏 評論

mob64ca14010a69 - 四卡2080ti deepseek

建設內容有哪些? (一)路空一體化多維地圖 / 模型信息服務體系 “北斗 PNT 體系應下沉至現代化基礎設施體系。”這是國家“十四五”規劃及《2022 年中國衞星導航與位置服務產業發展白皮書》中明確提出的內容。而如何瞄準現代路空一體化基礎設施建設,充分挖掘其內在含義和應用範疇,核心就是對於路空一體化所涉及基礎設備設施進行空間數字化,完

大數據 , 文心一言 , 物聯網 , 四卡2080ti deepseek , aigc , 人工智能 , 高精度

收藏 評論