大數據

標籤

貢獻412

3739

05:15 PM · Oct 25 ,2025

tech 頭像

elhix0bg 頭像

u_15844731 頭像

dolphinscheduler 頭像

ververica 頭像

seatunnel 頭像

zhaoqianglaoshi 頭像

huikaichedemianbao 頭像

@tech

暱稱青雲交技術圈

Last seen
@nebulabio

暱稱北京辰輝創聚生物

Last seen
@u_16272508

暱稱事辯天下

Last seen
@elhix0bg

暱稱阿里雲大數據AI

Last seen
@u_15844731

暱稱阿森CTO

Last seen
@u_14767244

暱稱u_14767244

Last seen
@dolphinscheduler

暱稱海豚調度

Last seen
@ververica

暱稱ApacheFlink

Last seen
@seatunnel

暱稱SeaTunnel

Last seen
@zhaoqianglaoshi

暱稱趙渝強老師

Last seen
@huikaichedemianbao

暱稱合合技術團隊

Last seen
@u_15591410

暱稱我就是不長肉而已

Last seen

@大數據 / 博客 RSS 訂閱

Nov 27 2025

智慧編織者 - 數據倉庫 etl 工具腳本 kafka 數據倉庫etl開發過程

本文是關於計劃、設計和實現基本數據倉庫解決方案的系列文章的第 3 部分，將設計和實現倉庫 ETL 過程，並瞭解倉庫的性能和安全問題。請多多支持作者作品RKWeb1.1 asp.net開發模板！有效提高asp.net開發效率60%以上的代碼框架！類似java的struts+spring+hirbenate 下

商業智能 , 大數據 , 數據倉庫 , 數據庫 , db2 , ibm

Dec 11 2025

墨香四溢 - yarn HA切換主節點

今天需要處理一個問題，已經困擾用户3天了。問題是全新構建羣集後，無法模擬故障，手動切換磁盤到其他羣集節點也失敗。簡單的將，配置羣集時，共享磁盤在那個羣集節點上，這些磁盤就一直在該節點上，無法將磁盤切換到其他主機上。即便是將生效的節點關機，磁盤也無法再其他節點掛在。重新安裝系統，新的主機名和羣集名，重新劃分Lun……統統都試了，無效！經過了4個多小時的排查，終於修復了。

windows , 大數據 , yarn , 主機名 , 操作系統 , server , yarn HA切換主節點

Nov 21 2025

信息流星 - db2 刪除分區報錯 set integrity

海量信息即大規模數據，隨着互聯網技術的發展，互聯網上的信息越來越多，如何從海量信息中提取有用信息成為當前互聯網技術發展必須面對的問題。在海量數據中提取信息，不同於常規量級數據中提取信息，在海量信息中提取有用數據，會存在以下幾個方面的問題：（1）數據量過大，數據中什麼情況都可能存在，如果信息數量只有20條，人工可以逐條進行查找、

海量數據 , 大數據 , 字符串 , 數據 , 算法 , 數據倉庫

Dec 12 2025

墨色天香 - vba 根據紙張索引號返回紙張的釐米單位的寬高

Sub glkCurrentDocPageSetup() Dim glkDoc As Document '定義變量 Set glkDoc = Application.ActiveDocument '設置為當前文檔 With glkDoc '設置文檔參數 With .PageSetup '設置【頁面設置】參數 .Orien

經驗分享 , 大數據 , 數據倉庫 , 邊距 , ci , 縮進

Dec 04 2025

北京辰輝創聚生物 - 重組蛋白：從基因序列到藥物設計的核心引擎

在現代藥物開發的宏偉藍圖中，重組蛋白已從一個前沿生物技術概念，演變為不可或缺的核心工具與目標。它們如同高度精密的分子鑰匙，不僅幫助科學家解鎖疾病的機制，其本身更是構成新一代療法的主體。理解重組蛋白的技術內涵，是從分子層面洞察現代藥物設計邏輯的起點。一、重組蛋白：精準設計的分子機器重組蛋白是指利用重組DNA技術，在特定的宿主系統中表達和生產的蛋白質

蛋白表達 , 蛋白純化 , 大數據 , Fc融合蛋白 , 數據倉庫 , 翻譯後修飾 , 人源化抗體

Nov 27 2025

北京辰輝創聚生物 - 細胞因子風暴：機制、研究與體外模型構建策略

在生命科學和免疫學研究中，“細胞因子風暴”是一個無法忽視的高頻術語。它不僅是重症感染（如COVID-19）、膿毒症、CAR-T治療等過程中危及生命的核心病理生理事件，更是連接基礎免疫與臨牀轉化的關鍵研究節點。從科研試劑的應用角度，深入理解其發生機制並建立可靠的體外研究模型，對於藥物篩選、致病機理探索和安全性評估具有至關重要

體外模型 , 大數據 , 細胞因子 , 數據倉庫 , 生長因子 , CRS , 細胞因子風暴

Dec 15 2025

jordana - 二級索引存儲多少數據

介紹 Ext2文件系統全稱為Second Extended FileSystem（第二擴展文件系統），既然是第二個那麼就存在第一個，第一個就是擴展文件系統 Extended FileSystem。當然還有Ext3和Ext4，Ext4還是很不錯的的文件系統，但是brtfs是目前的主流Linux文件系統。磁盤佈局名詞引

大數據 , 文件系統 , 數據塊 , 數據倉庫 , Linux , 系統架構 , 二級索引存儲多少數據

Dec 04 2025

jiecho - 星火飛碼iFlyCode 使用索引庫

Linux簡介 Linux 內核最初只是由芬蘭人林納斯·託瓦茲（Linus Torvalds）在赫爾辛基大學上學時出於個人愛好而編寫的。 Linux 是一套免費使用和自由傳播的類 Unix 操作系統，是一個基於 POSIX 和 UNIX 的多用户、多任務、支持多線程和多 CPU 的操作系統。 Linux 能運行主要的 UNIX 工具軟件、應用程序和網絡協議。它支

大數據 , 多用户 , 星火飛碼iFlyCode 使用索引庫 , 數據倉庫 , 運行級別 , 重啓

selectdb 頭像

Jan 21 2025

SelectDB技術團隊 - 金融場景 PB 級大規模日誌平台：中信銀行信用卡中心從 Elasticsearch 到 Apache Doris 的先進實踐

導讀：中信銀行信用卡中心每日新增日誌數據 140 億條（80TB），全量歸檔日誌量超 40PB，早期基於 Elasticsearch 構建的日誌雲平台，面臨存儲成本高、實時寫入性能差、文本檢索慢以及日誌分析能力不足等問題。因此使用 Apache Doris 替換 Elasticsearch，實現資源投入降低 50%、查詢速度提升 2～4 倍，同時顯著提高了運維效率。本文轉錄自陳地長（中信信用卡中

elasticsearch , 日誌分析 , 大數據 , 金融 , 數據庫

Nov 22 2025

我就是不長肉而已 - SBD521S-30-ASEMI可直接替代安世1PS79SB10

編輯：ll SBD521S-30-ASEMI可直接替代安世1PS79SB10 型號：SBD521S-30 品牌：ASEMI 封裝：SMAF 正向電流：0.2A 反向電壓：30V 正向壓降：0.55V~0.95V 引線數量：2 芯片個數：1 芯片尺寸：MIL 漏電流：10ua 恢復時間：35ns 浪涌電流

ASEMI , 大數據 , SBD521S-30 , hadoop , 在51CTO的第一篇博文 , 肖特基二極管

Nov 29 2025

信息流星 - 2021年最新最全Flink系列教程

1. 什麼時候需要“混用”？先用 Table 生態（Catalog、Connector、SQL 函數）做取數/清洗，再回到 DataStream 寫低階算子（自定義定時器、精細狀態）。某些無狀態歸一化（大小寫、正則清洗、簡單投影）交給 SQL；複雜業務/亂序處理交給 DataStream。歷史補數（有界流）走 Ba

服務器 , 大數據 , 自定義 , 後端開發 , flink , SQL , Python

Dec 01 2025

mob64ca1400133b - 文件管理索引分配中邏輯塊號與物理塊號

第十一章 EXT2文件系統以下內容是我對本章部分內容的學習總結一、EXT2文件系統數據結構 1、虛擬磁盤佈局每當文件系統需要從包含它的塊設備中讀取信息或數據，就將請求底層的設備驅動讀取一個基本塊大小整數倍的數據塊。 EXT2文件系統將它所使用的邏輯分區劃分成數據塊組。每個數據塊組都將那些對文件系

文件管理索引分配中邏輯塊號與物理塊號 , 大數據 , 文件系統 , 數據塊 , 數據倉庫 , 描述符

Nov 22 2025

編程小匠人 - Flink學習筆記（四）State管理與恢復

Apache Flink State Backends 詳解 1. 基本概念 State Backend（狀態後端）是 Flink 用於存儲和管理狀態的組件。它決定了狀態數據的存儲位置、存儲格式以及如何進行檢查點操作。Flink 提供了多種狀態後端實現，每種都有其特定的適用場景和優缺點。 2. 狀態後端類型 2.1 MemoryS

大數據 , 檢查點 , 後端開發 , flink , harmonyos , apache

Nov 25 2025

技術領航者之聲 - DB2 jabcd連接串socketTimeout

以遞歸方式處理數據關係的一種新方法 Birgitta Hauser, 軟件工程師, Toolmaker Advanced Efficiency GmbH 簡介：根據 SQL 標準，分級數據（如組織圖和材料單）或雙向數據（如航班中轉）可以通過使用遞歸通用表表達式 (RCTE) 進行評估。DB2 for i 的 V5R4 版本中提供了 RCTE 功能。其他的數據庫（如 O

大數據 , 遞歸 , 數據 , 數據倉庫 , SQL

seatunnel 頭像

Jul 22 2025

SeaTunnel - 破 400！Apache SeaTunnel 成為全球開發者共建熱土

隨着 Apache SeaTunnel 項目在全球數據集成領域的不斷髮展壯大，今天我們迎來了一個重要的里程碑 —— GitHub 貢獻者數量正式突破 400 人！ 🎉 這不僅是一個數字的躍升，更是全球開發者對 SeaTunnel 技術價值與開源精神的持續認可和熱情參與。 Apache SeaTunnel 成長軌跡一覽作為 Apache 軟件基金會旗下的頂級項目，Apache SeaTunne

github , 大數據 , 開源 , seatunnel , 開發者

Dec 12 2025

網絡安全俠 - pgsql 實體化視圖索引

簡介： MView中文名稱為實體化視圖（Materialized View），相對於普通的視圖來説，MView的不同之處在於MView實體化視圖管理存儲數據，佔據數據庫的物理空間。MView的結果會保存在一個普通的數據表中，在對MView進行查詢的時候不再會對創建MView的基表進行查詢，而是直接查詢MView對應的結果表，然後通過定期的刷

大數據 , 數據 , 數據倉庫 , 數據庫 , pgsql 實體化視圖索引 , 物化視圖

yunrizhi_daishuyun 頭像

Apr 16 2024

雲掣科技 - 開源大數據集羣部署（二十一）Spark on yarn 部署

作者：櫰木 1 spark on yarn安裝（每個節點） cd /root/bigdata/ tar -xzvf spark-3.3.1-bin-hadoop3.tgz -C /opt/ ln -s /opt/spark-3.3.1-bin-hadoop3 /opt/spark chown -R spark:spark /opt/spark-3.3.1-bin-hadoop3 2 配置環境變量及

大數據 , 集羣

163yun 頭像

Aug 05 2022

網易數帆 - 直播預約丨流式湖倉服務，大數據的終結？這場開源發佈會為你揭曉！

【點擊立刻報名】 8月11日，網易數帆將舉辦“企業級流式湖倉服務 Arctic 開源發佈會”，邀請網易數帆大數據產品線及合作伙伴相關負責人聯袂解讀對數據技術演進及 Arctic 開源的思考，介紹 Arctic 項目進展、未來發展及社區規劃，分享企業湖倉一體實踐成果與心得。數據基礎設施發展的腳步從未停歇，當前風頭正盛的是湖倉一體（Lakehouse）。湖倉一體，顧名思義

大數據 , 數據結構 , 架構設計 , 架構模式

Jan 08 2026

ApacheSeaTunnel - Apache SeaTunnel 2025 案例精選重磅發佈！

🎉哇塞！《2025 年 Apache SeaTunnel 案例精選集》閃亮登場啦！免費領取通道開啓，限時 7 天，手快有手慢無哦，寶子們衝呀！過去這一年，Apache SeaTunnel 就像個數據小能手，成功“打入”眾多企業的生產環境，為那些複雜的數據同步和集成難題，量身定製超棒的解決方案。社區小夥伴們超用心，把這些應用實踐精心整理，編成了這本案例集。豐富案例，全

spark , 大數據 , 數據 , 案例 , Apache SeaTunnel , 解決方案 , apache

Dec 25 2025

技術極客傳奇 - XSSFSheet獲取列索引

每一個xls都對應一個唯一的HSSFWorkbook，每一個HSSFWorkbook會有若干個HSSFSheet，而每一個HSSFSheet包含若干HSSFRow（Excel 2003中不得超過65535行），每一個HSSFRow又包含若干個HSSFCell（Excel 2003中不得超過256列）。為了遍歷所有的單元格，我們就得獲得某一個HSSFSheet的所有HSSF

大數據 , 數據倉庫 , i++ , 打開文件 , FileStream , XSSFSheet獲取列索引

Nov 15 2025

事辯天下 - 歐神諾中國玉第2屆空間設計大賽圓滿落幕，共築行業設計新生態！

11月11日，歐神諾金橄欖獎·中國玉第2屆空間設計大賽頒獎典禮在佛山歐神諾總部展廳圓滿落幕。活動現場匯聚了大咖評審、獲獎設計師、行業媒體等眾多嘉賓，共同見證了一場融合設計創意、產品美學與文化深度的行業盛宴。 01 賦能設計師成長見證年度大獎榮耀誕生活動開場，帝歐水華集團總裁、歐神諾瓷磚董事長兼總裁吳志雄誠摯歡迎蒞臨典禮的來賓，衷心感謝各位設計師

自啓動 , 大數據 , 錨點 , 數據倉庫 , 整合資源

Nov 21 2025

事辯天下 - 飛秒激光輔助白內障手術，北京愛爾英智眼科醫院丁雪為您解讀

瞭解過白內障手術的朋友，或多或少都聽過這個名字——“飛秒激光輔助白內障手術”。也有人發出質疑，這究竟是物有所值的“黑科技”，還是瞄準了人們追求高端手術方式心理的“智商税”？今天，就請北京愛爾英智眼科醫院白內障科丁雪主任為大家詳細講解。手術是全球眼科醫學界公認的治療白內障唯一有效的方法，目前白內障手術主要可分為傳統白內障超聲乳化吸除術和飛秒激光白內障手術。傳統白內障

大數據 , 機械臂 , 數據倉庫 , 黑科技

Dec 29 2025

藍夢之翼 - Spark Streaming概述

一、定義 Spark Streaming 是 Spark 的流式數據處理模塊。Spark Streaming 支持的數據輸入源有很多，例如：Kafka、Flume、Twitter、ZeroMQ 和簡單的 TCP 套接字等。二、DStream 和 Structured Streaming Spark Streaming 使用離散化流（DStream）作為

spark , Streaming , 大數據 , 數據 , API

Nov 19 2025

mob64ca140ce312 - 2分鐘讀懂Hadoop和Spark的異同

從數據處理流程看 Hadoop 與 Spark：批處理、流處理的實現差異 Hadoop 和 Spark 都是大數據處理框架的核心技術，但它們在數據處理流程（包括批處理和流處理）的實現上存在顯著差異。下面我將從數據處理流程的角度（數據輸入、處理引擎、數據輸出）逐步分析這些差異，幫助您理解各自的優勢和適用場景。回答基於真實技術原理，確保可靠。 1

spark , 大數據 , 數據 , hadoop , 前端開發 , Javascript