tag apache

標籤
貢獻80
146
05:12 PM · Oct 25 ,2025

@apache / 博客 RSS 訂閱

SelectDB技術團隊 - 更高效的數據處理解決方案:基於 MinIO 部署 Apache Doris 存算分離版本實踐

引言 現代數據處理在多維度面臨嚴峻挑戰,一方面,數據量的持續增長致使傳統存儲成本居高不下,非結構化數據所佔比例日益攀升,進一步加重了存儲負擔,且數據質量問題推高了存儲和清洗成本;另一方面,企業內部往往存在多套系統,數據難以集成,這對數據分析的成本和時效性也提出了更高的要求。 Apache Doris 作為一款具備高性能的實時分析數據庫,擁有湖倉一體的能力。當它與 MinIO 這樣高性能且 S3 兼

教程 , 知識 , apache

收藏 評論

SelectDB技術團隊 - 從 Snowflake 到 Apache Doris:Planet 實時分析成本直降 80%、查詢加速 90 倍

Planet 是一家全球領先的金融科技企業,在零售、酒店和旅遊行業的支付與税務數字化服務領域深耕近四十年。公司業務廣泛,覆蓋支付處理、免税退税及行業軟件等,致力於通過一體化的解決方案提升全球商户的運營效率與顧客體驗。 為了應對日益增長的數據分析需求並優化成本效益,Planet 數據團隊近期主導完成了一項重要的數據倉庫升級,將系統從 Snowflake 遷移至開源的 Apache Doris。 這次

資訊 , apache

收藏 評論

藍易雲 - 藍易雲cdn:Redis是如何保證高可用的?

Redis的高可用架構是其在生產環境穩定運行的核心能力之一。它通過多層機制(主從複製、哨兵監控、Cluster集羣)實現故障自動轉移與數據冗餘,從而保障系統在節點宕機、網絡異常或硬件故障時依然能持續服務。下面從機制原理、核心命令解釋、以及工作流程三個角度系統分析。⚙️ 一、核心機制解析 機制名稱 核心作用 高可用特性 典型應用場景 f

kubernetes , devops , serverless , Docker , apache

收藏 評論

藍易雲 - 藍易雲cdn:PySpark安裝及WordCount實現(基於Ubuntu)

以下內容將詳細介紹在 Ubuntu 系統上安裝 PySpark 並實現一個經典的 WordCount(單詞計數)示例。 整個過程從環境配置到程序運行,結構清晰,邏輯嚴謹,適合數據工程入門與分佈式計算基礎學習 🧠。 🚀 一、PySpark 概述 PySpark 是 Apache Spark 的 Python 接口,它將分佈式計算框架與 Python 生態結合,能在多節點環境下對大規模數據

kubernetes , devops , serverless , Docker , apache

收藏 評論

酷克數據HashData - Greenplum 替代項目 Apache Cloudberry 孵化週年總結

Apache Cloudberry™ (Incubating) 是 Apache 軟件基金會孵化項目,由 Greenplum 和 PostgreSQL 衍生而來,作為領先的開源 MPP 數據庫,可用於建設企業級數據倉庫,並適用於大規模分析和 AI/ML 工作負載。 GitHub: https://github.com/apache/cloudberry 作者:王殿進,Apache Cl

數據庫 , apache

收藏 評論

SelectDB技術團隊 - 貨拉拉用户畫像基於 Apache Doris 的數據模型設計與實踐

貨拉拉是國內領先的同城貨運數字化平台,成立於 2013 年。截⾄2025 年 4⽉ ,貨拉拉業務覆蓋全球 14 個市場 ,400+ 城市 ,其中中國內地總共覆蓋 363 座城市 ,⽉活司機達 120 萬 ,⽉活⽤户達 1400 萬, 並在全球設有 6 個數據中⼼。作為共享經濟模式的代表企業 ,貨拉拉通過移動互聯⽹技術整合社會運⼒資源 ,為⽤户提供即時貨運、企業物流、搬家服務等多元化解決⽅案。 在龐

數據庫 , apache

收藏 評論

SelectDB技術團隊 - Apache Doris Summit 2025 圓滿收官,一文速覽峯會高光時刻!

2025 年 11 月 5 日至 6 日,由飛輪科技主辦的 Apache Doris Summit 2025 技術峯會圓滿落下帷幕。本次峯會以 “Powering Real-Time Analytics Search in the AI Era” 為主題,通過線上直播的形式,成功吸引了全球的 10 萬+開發者、架構師和數據技術專家的參與。大家齊聚雲端,共探 AI 時代背景下,數據價值釋放的全新路

資訊 , 數據庫 , 人工智能 , apache

收藏 評論

藍易雲 - 藍易雲cdn:深入探索Java中的併發編程:CAS機制的原理與應用

藍易雲CDN:深入探索 Java 併發編程——CAS 機制的原理與應用 ⚙️ 在現代高併發系統中,性能優化的核心往往不在“算法”,而在線程安全與同步策略。Java 的 CAS(Compare And Swap,比較並交換) 就是併發編程的關鍵基石,它以無鎖化的思想構建出高性能的線程模型,讓多線程競爭變得高效、輕量、可控。 一、CAS 的核心思想 🔍 CAS(比較並交換) 是一種原子操作,用於在

kubernetes , devops , serverless , Docker , apache

收藏 評論

SelectDB技術團隊 - 替換 ClickHouse,查詢併發提升 7 倍!高途教育基於阿里雲 SelectDB 構建秒級實時報表

導讀 高途教育引入阿里雲 SelectDB 替換 ClickHouse、MySQL 作為核心分析引擎,統一支撐續班與行課實時分析等核心業務。通過阿里雲 SelectDB MPP 架構與向量化查詢引擎,結合 SelectDB 倒排索引、Bloom Filter 等豐富索引機制,實現億級數據量秒級多表關聯查詢,在 700+ 高併發查詢壓力下 P99 延遲低於 200ms,穩定滿足核心報表 2s 內響應

資訊 , 數據庫 , apache

收藏 評論

軟件求生 - Java 面試高頻題:Tomcat 頂層架構怎麼答?看完這篇直接揹走滿分答案!

那天的面試現場,我腦袋突然空白 上週我去參加一家金融科技公司的 Java 高級開發面試。一切都挺順利,Redis、JVM、Spring 全答得順風順水。 直到面試官輕輕一笑,説了一句: “那我們來聊聊 Tomcat 吧,説説你對它的頂層架構理解?” 當場我腦子“嗡”的一聲: ——Tomcat 架構?我只記得 Cat

yyds乾貨盤點 , HTTP , 後端開發 , server , JAVA , apache

收藏 評論

lenglingx - flink-cdc同步mysql到doris的一個常見的數據類型錯誤處理

flink-cdc同步mysql到doris的一個常見的類型錯誤處理 一、varchar類型 日誌報錯如下: java.lang.IllegalArgumentException: Variable character string length must be between 1 and 21474

MySQL , 數據庫 , JAVA , flink , apache

收藏 評論

雲端築夢工匠 - Ubuntu10.10安裝Drupal7及其環境(apache,mysql,php)

文章:Drupal 開發環境搭建(在 Windows 中通過 WSL 配置 Ubuntu+Apache+PHP+MariaDB+Drupal+Drush開發環境) 1. 補充知識 1.1 在 Windows11 中通過 WSL 配置 Ubuntu 系統的好處 最初我是直接在Windows系統中搭建的Apache+PHP+Drupal開發環境,但出現了一個問題:操

Drupal , 前端開發 , apache , Javascript , Ubuntu

收藏 評論

mob64ca12ddcacc - spark saveAsTable 數據源拉了兩次數據

在使用 Apache Spark 進行數據處理時,我遇到了一個棘手的問題:使用 saveAsTable 方法將數據保存到 Hive 表時,數據源被拉取了兩次。這種情況不僅影響了處理效率,也浪費了計算資源。為了更好地記錄解決這個問題的過程,我着重從環境預檢、部署架構、安裝過程、依賴管理、配置調優和最佳實踐六個方面進行整理。 環境預檢 在進行解決方案之前,首先要確保我們的環境是配置正

spark , hive , aigc , apache

收藏 評論

IT劍客行 - dolphinscheduler工作流hive kerberos

第1章 DolphinScheduler簡介 1.1 DolphinScheduler概述 Apache DolphinScheduler是一個分佈式、易擴展的可視化DAG工作流任務調度平台。致力於解決數據處理流程中錯綜複雜的依賴關係,使調度系統在數據處理流程中開箱即用。 1.2 DolphinScheduler核心架構 Dolp

大數據 , MySQL , hive , hadoop , apache

收藏 評論