tag 大數據

標籤
貢獻394
342
05:15 PM · Oct 25 ,2025

@大數據 / 博客 RSS 訂閱

青雲交技術圈 - Java 大視界 -- 基於 Java 的大數據可視化在城市地下管網管理與風險預警中的應用

(centerJava 大視界 -- 基於 Java 的大數據可視化在城市地下管網管理與風險預警中的應用/center) 引言: 嘿,親愛的 Java 和 大數據愛好者們,大家好!我是CSDN(全區域)四榜榜首青雲交!凌晨三點的深圳福田區,一場突如其來的暴雨讓城市管網承受巨大壓力。Java 驅動的智慧管網系統正以毫秒級頻率分析着 1.2 萬路傳感器數據,當系統監測到某路段污水管道

spark , 大數據 , yyds乾貨盤點 , 數據 , JAVA , .net

收藏 評論

wx5d7321c78b265 - PHP 8.5 在性能、調試和運維方面的新特性

2025 年即將結束,這意味着 PHP 的新版本也已經發布了! 在本文中,我們將重點介紹那些你在上述文章中找不到的,關於 PHP 8.5 在性能、調試和運維方面的變化。 其中一些改動甚至是由 Tideways 的員工直接貢獻的。 你是不是最好奇 PHP 8.5 是否比舊版本性能更強?可以看看基準測試。 原文鏈接 PHP 8.5 在性能、調試和運維方面的新特性

大數據 , php , hive , INI

收藏 評論

SelectDB技術團隊 - 查詢提速 11 倍、資源節省 70%,Apache Doris 在網易日誌和時序場景的實踐

作者|隱形(邢穎), 網易資深數據庫內核工程師 編輯整理|SelectDB 技術團隊 導讀:作為網易重要的業務線,靈犀辦公和雲信針對大規模日誌/時序數據處理和分析的挑戰,分別構建了靈犀 Eagle 監控平台和雲信數據平台。本文將重點介紹 Apache Doris 在網易日誌和時序場景中的應用,如何使用 Apache Doris 替換 Elasticsearch 和 InfluxDB,從而實現更低的

elasticsearch , 日誌分析 , 大數據 , 時序數據庫 , 數據庫

收藏 評論

青雲交技術圈 - Java 大視界 -- Java 大數據機器學習模型在生物信息學基因功能預測中的優化與應用

(centerJava 大視界 -- Java 大數據機器學習模型在生物信息學基因功能預測中的優化與應用/center) 引言: 嘿,親愛的 Java 和 大數據愛好者們,大家好!我是CSDN(全區域)四榜榜首青雲交!而今天,我們將踏入一個全新的領域 —— 生物信息學,在這裏,Java 大數據與機器學習模型將碰撞出怎樣的火花,又將如何助力人類破解基因的奧秘?讓我們帶着滿滿的好奇,

機器學習 , spark , 基因功能 , 大數據 , yyds乾貨盤點 , 數據 , Java大數據 , JAVA

收藏 評論

合合技術團隊 - 以商業大數據技術助力數據合規流通體系建立,合合信息參編《數據經紀從業人員評價規範》團標

經國務院批准,由北京市人民政府、國家發展和改革委員會、工業和信息化部、商務部、國家互聯網信息辦公室、中國科學技術協會共同主辦的2023全球數字經濟大會於近期隆重召開。由數交數據經紀(深圳)有限公司為主要發起單位,合合信息等企業參編的《數據經紀從業人員評價規範》團體標準在聯合國科學和技術促進發展委員會、北京市通信管理局、世界銀行(The World Bank)等機構領導以及國內外數據要素領域知名專家

大數據 , 規範化 , 人工智能

收藏 評論

網絡小墨 - 論文索引快捷鍵

一、 引言 SCI (Science Citation Index) 科學索引指數是美國Thompson公司推出的一種為科學工作者論文檢索服務的論文引用指標。在我國它成為Thompson ISI論文檢索數據庫的代名詞。Thompson ISI論文檢索數據庫挑選世界上一批有影響的科學刊物,將其論文題目和作者及作者單位、文摘和引用論文進行檢索,建立數據

論文索引快捷鍵 , 大數據 , 數據 , 數據倉庫 , 數據庫 , 參考文獻

收藏 評論

mob64ca1402a190 - amabri yarn 隊列

一:隊列的概念、數據結構 隊列(Queue)是運算受到限制的一種線性表。只允許在表的一端進行插入,而在另一端進行刪除元素的線性表。隊尾(rear)是允許插入的一端。隊頭(front)是允許刪除的一端。空隊列是不含元素的空表。 假設有個隊列Q=(a1,a2,…,an),則a1為隊頭元素,an為隊尾元素。元素入隊的次序為a1,a2,…,an,而出隊的次序為a1,a2,…,

數組 , 大數據 , yarn , amabri yarn 隊列 , 出棧 , 入棧

收藏 評論

deanyuancn - zos db2

基本概念 Structured Query Language:結構化查詢語言 其實就是定義了操作所有關係型數據庫的規則,每一種數據庫操作的方式存在不一樣的地方,稱為“方言” SQL是Structured Query Language的縮寫,意思是結構化查詢語言,是一種在數據庫管理系統(Relational Database Management System,

大數據 , 數據 , 數據倉庫 , 數據庫 , zos db2 , SQL

收藏 評論

網絡安全守護先鋒 - 知識筆記:華為戰略規劃與執行的核心管理工具BLM模型

華為DSTE戰略管理體系 = 一套以客户為中心、以目標為導向、從戰略到執行閉環落地的“戰略操作系統”,它讓戰略不再是口號,而是可解碼、可衡量、可執行、可覆盤的組織能力。 一、DSTE戰略管理體系總覽 1. 什麼是DSTE? Develop Strategy To Execute:

華為 , 大數據 , 戰略規劃 , 後端開發 , 人工智能 , 灰度 , Python

收藏 評論

阿里雲大數據AI技術 - MaxCompute SQL AI:讓 SQL 成為你的 AI 語言

MaxCompute SQL AI 全新上線,一句SQL就能用上大模型,零門檻讓數據分析師秒變AI高手。 在大模型能力飛速進化、推理成本持續下降的今天,AI 正從“可選項”變為大數據處理流水線中的“必選項”。越來越多的場景——無論是文本摘要、實體抽取,還是多模態的圖像識別、金融風控中的行為分析——都開始用模型推理替代傳統的規則邏輯,實現更智能、更精準的數據

MaxCompute , 大數據 , 數據倉庫 , AI , 阿里雲 , SQL

收藏 評論

軟件部長 - 利用Java規則引擎進行決策配置:SQL變量的運用與實踐

SQL變量加工 SQL加工背景:在決策配置過程中,一些複雜的邏輯或模型可通過自定義SQL腳本編寫創建數據變量,通過SQL腳本可以便捷的從數據庫中取數,並且自定義SQL支持傳參,可滿足更復雜多變的數據加工處理。注意,SQL變量加工和算子編排加工的方式不同,SQL變量加工依賴於對應數據源的服務器的性能,在使用前,需要確認下數據庫是否有可用的多餘的性能滿足新增SQL執行的性能消耗(避免影響原有系統的性能

風險控制 , 大數據 , JAVA , SQL , 變量

收藏 評論

jordana - 怎麼查數據表沒有被使用過的索引或者使用較少的索引

1.1 查詢表中所有的行與列如下,那麼在查詢之前還是一樣要看一下表的結構 desc emp ; 若領導要看所有員工的信息,其實操作上很簡單隻需要在select * 後面加上表名即可,這個時候得到的結果是所有行與列的集合; 1.2從表中檢索部分行 查看公司有多少銷售人員,那麼只需

oracle , 運算符 , 大數據 , 字符串 , 數據 , 數據倉庫

收藏 評論

編程小天匠 - 【技術之聲】第三期(20220103)一週精選

▌引言:GEO 正在重構全球智能流量分配規則 2025 年,生成式 AI 搜索已完成從“技術探索”向“商業規模化應用”的關鍵躍遷。以 ChatGPT、DeepSeek、Gemini、Claude、豆包等為代表的 AI 搜索與問答系統,正在系統性重塑用户的信息獲取路徑,也由此重構了企業獲取流量、影響決策與實現轉化的底層邏輯。 在這一背景下,GEO(Generat

知乎 , 商業 , 大數據 , 搜索 , hadoop

收藏 評論

mob64ca1416f1ef - Triton inference server系列(0)——相關資料整理

Triton Inference Server 架構與前後處理方案梳理 文章目錄 Triton Inference Server 架構與前後處理方案梳理 0 引言 1 client方案--自己在client端增加前處理和後處理

spark , 共享內存 , 大數據 , analyzer , 架構 , c++

收藏 評論

AI領域佈道師 - spark2支持hint嗎

目錄 條件 安裝 scala 發到虛擬機上,解壓 配置環境變量 配置SCALA_HOME,然後在PATH變量後加上`:$SCALA_HOME/bin` 驗證 spark 下載 解壓 配置環境變量

spark , 大數據 , hadoop , spark2支持hint嗎

收藏 評論

mob64ca14133dc6 - 計算機網絡常見面試題 - 楊柳依依

UDP和TCP是傳輸層最重要的兩種協議,它們的區別從根本上決定了互聯網上各種應用的表現。 簡單來説: TCP像打電話:需要接通、確認對方能聽到、有條理地對話、最後説再見。可靠,但步驟多。 UDP像發傳單:把傳單扔出去就行,不關心對方是否收到、是否按順序收到。快速,但不可靠。 下面通過一個詳細的表格和解釋來全面對

大數據 , tcp , ip , hadoop , udp , 網絡協議

收藏 評論

數據庫知識分享者 - 阿里巴巴雲原生大數據運維平台 SREWorks 正式開源

簡介:阿里巴巴雲原生大數據運維平台 SREWorks,沉澱了團隊近10年經過內部業務錘鍊的 SRE 工程實踐,今天正式對外開源,秉承“數據化、智能化”運維思想,幫助運維行業更多的從業者採用“數智”思想做好高效運維。 作者 | 晟白 來源 | 阿里技術公眾號 隨着行業不斷髮展,大數據AI也逐漸呈現雲原生化的趨勢。複雜的業務場景及其背後涉及到的不同技術方向的開源和自研,使得產品運維面臨技術複雜

阿里巴巴 , 大數據

收藏 評論

chaokunyang - Apache Fury 0.5.1 版本正式發佈

大家好,非常高興向大家發佈 Apache Fury 0.5.1 版本。該版本包含了來自七個 contributor的37個PR的貢獻,可以參考[安裝]()文檔獲取最新版本。 Release Notes:https://github.com/apache/incubator-fury/releases/tag/v0.5.1 Apache Fury簡介 Apache Fury 是一個基於JIT動

序列化 , 大數據 , 微服務 , rpc , JAVA

收藏 評論

得物技術 - 深入剖析時序Prophet模型:工作原理與源碼解析|得物技術

隨着得物業務的快速發展,積累了大量的時序數據,這些數據對精細化運營,提升效率、降低成本有着重要作用。在得物的時序數據挖掘場景中,時序預測Prophet模型使用頻繁,本文對Prophet的原理和源碼進行深入分析,歡迎閲讀和交流。 一、引入 時間序列是指按照時間先後順序收集或觀測的一系列數據點,這類數據通常都具有一定時間相關性,基於這種順序性,我們可以對時間序列進行多種數據挖掘任務,包括分類、聚類、異

序列化 , 大數據 , 時序數據庫 , 源碼分析 , 模型

收藏 評論

Mulavar - 【Flink】TaskManager 內存模型及計算邏輯詳解

本文旨在詳解 Flink TaskManager 的內存模型以及其各部分內存佔比的計算邏輯。首先,結合官網展示了當前 Flink 的內存模型,並在之後結合 JVM 自身內存模型和管理機制結合講解 Flink 內存模型的各個部分,最後結合源碼解釋了各部分內存佔比的計算邏輯。 1 內存模型組成部分 本節摘自官網:https://nightlies.apache.org/flink/flink-docs

內存 , 大數據 , jvm , 源碼分析 , flink

收藏 評論

Alluxio - Alluxio在數據索引和模型分發中的核心價值與應用

在當前的技術環境下,搜索、推薦、廣告、大模型、自動駕駛等領域的業務依賴於海量數據的處理和複雜模型的訓練。這些任務通常涉及從用户行為數據和社交網絡數據中提取大量信息,進行模型訓練和推理。這一過程需要強大的數據分發能力,尤其是在多個服務器同時拉取同一份數據時,更是考驗基礎設施的性能。 在這樣的背景下,Alluxio Enterprise AI 在數據索引與模型分發/部署方面展示了其獨特的優勢,特

大數據 , 索引 , 人工智能 , 模型

收藏 評論

StarRocks - StarRocks 在愛奇藝大數據場景的實踐

作者:林豪,愛奇藝大數據 OLAP 服務負責人 小編導讀: 本文整理自愛奇藝工程師在 StarRocks 年度峯會的分享,介紹了愛奇藝 OLAP 引擎演化及引入 StarRocks 後的效果。 在廣告業務中,StarRocks 替換 Impala+Kudu 後,接口性能提升 400%,P90 查詢延遲縮短 4.6 倍。 在“魔鏡”數據分析平台中,StarRocks 替代 Spar

大數據 , spa , olap

收藏 評論

Aloudata大應科技 - 重磅活動!3.14,與數智領袖共探 NoETL 指標平台最佳實踐

NoETL 指標平台重塑了指標開發協作模式。Aloudata CAN 以強大的指標定義和查詢加速能力,直連數倉公共層明細數據,自動化代持寬表與彙總表開發,實現了 NoSQL 指標定義、NoETL 指標開發、統一指標管理,一舉解決了指標“開發週期長、口徑不統一、分析不靈活、冗餘成本高”等頑疾,並在金融、消費零售、製造、ICT、能源、航空、醫療等多行業打造了標杆案例,為企業數據開發、消費與管理帶來了顛

數據管理 , 大數據 , 數據結構 , 數據庫 , 數據分析

收藏 評論

趙渝強老師 - 【趙渝強老師】Kafka消息的消費模式

Kafka消費者組中的消息消費模型有兩種,即:推送模式(push)和拉取模式(pull)。視頻講解如下: https://www.bilibili.com/video/BV1kG23Y4EZP/?aid=113282815891... 一、消息的推送模式 這種消息的消費模式需要記錄消費者的消費者狀態。當把一條消息推送給消費者後,需要維護消息的狀態。如果這條消息已經被消費將會對消息進行標記。這

大數據 , kafka

收藏 評論