tag 數據倉庫

標籤
貢獻158
141
01:08 PM · Nov 03 ,2025

@數據倉庫 / 博客 RSS 訂閱

程序猿追 - 【徵文計劃】使用Rokid CXR-M和CXR-S SDK構建智能維修助手

一、引言:AI眼鏡如何重塑工業維修 在傳統工業維修現場,工程師常常面臨一個尷尬困境:需要同時操作工具、查閲圖紙和記錄數據,但人類只有兩隻手。這種頻繁的場景切換不僅降低了效率,更增加了出錯風險。 Rokid AR眼鏡為解決這一痛點提供了完美方案。通過CXR-M SDK(移動端開發套件)和CXR-S SDK(眼鏡端開發套件),開發者可以構建能夠將數字信息疊加到真實世界的智

大數據 , 數據倉庫 , Android , ide

收藏 評論

coolfengsy - ollama裏的切片和arg的模型是哪些

OLAP和BI是日常工作中比較熟悉的了,也是經常會接觸到的,這裏總結下。 這裏先説一個概念:數據立方體 我們分析一堆數據報告時候通常這些數據報告採用二維表示,是行與列組成的二維表格。但在我們分析數據的角度很可能有多個,數據立方體可以理解為就是維度擴展後的二維表格。但更多時候數據立方體是多維的,如下圖數據立方體: 數據立方體中常規的五大操作:切片,切塊,旋

建模 , 數據 , 數據倉庫 , aigc , bard

收藏 評論

北京辰輝創聚生物 - 重組蛋白技術基礎概述

重組蛋白的基本概念 重組蛋白是通過基因重組技術在宿主系統中表達的外源蛋白。該技術將目標基因導入表達載體,轉化至宿主細胞,利用細胞自身的轉錄翻譯機制合成目標蛋白。與傳統組織提取相比,重組技術可獲得更高純度、更好一致性的蛋白樣品。 重組蛋白的技術特徵 重組蛋白的生物學功能由其空間構象決定。氨基酸序列通過分子內氫鍵、疏水作用、二硫鍵等化學力形成特定三維結構。研

蛋白表達 , 大數據 , 細胞因子 , 重組蛋白 , 數據倉庫 , 生長因子 , 科研試劑

收藏 評論

laojean - DB25交叉線

RS-232、RS-422與RS-485都是串行數據接口標準,RS-232是PC機與通信中應用最廣泛的一種串行接口。RS-232被定義為一種在低速率串行通訊中增加通訊距離的單端標準。RS-232採取不平衡傳輸方式,即所謂單端通訊,而RJ45接口通常用於數據傳輸,最常見的應用為網卡接口。 RS-232是為點對點(即只用一對收、發設備)

大數據 , DB25交叉線 , 數據倉庫 , 422器件與lvds接收器的區別 , rs232接口 , rj45接口線序 , rs232 距離

收藏 評論

事辯天下 - 星期零升級版雞蛋豆腐上架山姆

近日,星期零煥新升級的雞蛋豆腐在山姆會員商店全國門店正式上架。相較此前版本,新品在原料、營養與包裝等多方面實現迭代,同時保留了開盒即食和多樣化烹飪的便利性,為日常餐桌提供更豐富的蛋白選擇。 在此次產品升級中,星期零在原有非轉基因黃豆的基礎上,新增來自東北的一 級黑豆原料,形成“黃豆+黑豆”的雙豆配方。黑豆富含優質植物蛋白及膳食纖維,近年來在豆製品創新中獲得了

大數據 , 數據 , 數據倉庫 , 應用場景 , 迭代

收藏 評論

lu952450497 - 數據建模中不同模型的區別與適用場景的討論

數據建模是數據開發體系中的核心環節,它直接決定數據資產質量、可維護性、複用能力,以及最終對業務價值的支撐能力。建模不是單純字段命名與表結構設計,而是一套體系化的抽象方法論。此文將從模型體系説明開始,逐一拆解建模方式區別、典型適配場景與落地難點。 1. 為什麼需要數據建模 數據建模目標並非“定義表結構”,而是實現: 指標口徑統一 跨主題數據複用

大數據 , 建模 , 數據 , 數據倉庫 , 複用

收藏 評論

事辯天下 - 奧哲2025未來企業大會|智現新生12月5日開啓!

彷彿AI早已觸手可及,為何企業佈局AI仍如履薄冰? 當AI浪潮奔涌而至,企業佈局AI卻深陷迷局:投資與回報難以衡量、人才與組織出現斷層、技術與業務割裂、藍圖難以落地兑現價值。企業AI究竟從何做起,由誰來做,如何落地?企業亟需一場破土新生的變革。 在這關鍵轉折點,奧哲在12月5日隆重舉辦「智現新生 | 2025未

it , 大數據 , 數據 , 數據倉庫 , 企業級

收藏 評論

温柔一刀 - goland索引建立

gocolly是用go實現的網絡爬蟲框架,目前在github上具有3400+星,名列go版爬蟲程序榜首。gocolly快速優雅,在單核上每秒可以發起1K以上請求;以回調函數的形式提供了一組接口,可以實現任意類型的爬蟲;依賴goquery庫可以像jquery一樣選擇web元素。 gocolly的官方網站是http://go-colly.org/,提供

github , 大數據 , 數據倉庫 , text , 示例代碼 , goland索引建立

收藏 評論

cnolnic - 關係型數據庫能換成分佈式數據庫麼

在SQL Server中的關係型數據倉庫分區策略(1) http://developer.51cto.com 2007-02-27 17:01 Gandhi Swaminathan 51CTO.com 我要評論(0) 分區,在Microsoft SQL Server中,便於

大數據 , 數據倉庫 , microsoft , 關係型數據庫能換成分佈式數據庫麼 , 磁盤 , SQL Server

收藏 評論

lu952450497 - 數據開發中的技術選型:從業務訴求到方案落地的全流程思考

企業的數據開發體系,往往伴隨着業務規模增長逐步演進。數據的產生源頭複雜、數據量不斷擴大、業務部門對數據的依賴程度提高,導致數據開發能力是否合理選型,將直接影響數據平台的穩定性、擴展性以及成本投入。 一、需求分析是技術選型的起點 在很多實際項目中,技術選型失敗主要不是因為技術不好,而是對實際訴求理解不清。技術選型之前應明確以下問題: 數據規

技術選型 , 大數據 , 數據 , hive , 數據倉庫

收藏 評論

阿森CTO - Linux管理文件與處理數據

@TOC 📝前言 本文將介紹Linux系統中的常用命令:mv、cat、echo、重定向、head和tail,主要用於文件管理和數據處理。重點講解mv命令和重定向的示例,最後演示如何用head和tail快速提取大型文件中的指定行。 🌠 mv指令(重要): mv命令是move的縮寫,可以用來移動文件或者將文件改名(move (rename) fil

文件描述符 , 大數據 , yyds乾貨盤點 , 數據倉庫 , 重定向 , 標準輸出

收藏 評論

夢想啓航吧 - 150g存儲會消耗多少存儲建立索引

給你100M空間你可以做多少事?一起來分析吧!100M的網站空間到底能放多少內容?" 很多用户對此問題還不甚瞭解,下面我就就此問題解釋一下吧! 100M的空間,就目前的存儲設備來説,簡直微不足道。但對於一般建站的用户來説,還是可以的。雖不敢説綽綽有餘,但放一個小型網站還是足夠了的。 下面我們一起來具體分析一下這100M的空間到

150g存儲會消耗多少存儲建立索引 , 大數據 , 建站 , 數據倉庫 , 數據庫 , bc

收藏 評論

誤會一場 - 搜索分詞器和索引分詞器

三大主流分詞方法:基於詞典的方法、基於規則的方法和基於統計的方法。 1、基於規則或詞典的方法 定義:按照一定策略將待分析的漢字串與一個“大機器詞典”中的詞條進行匹配,若在詞典中找到某個字符串,則匹配成功。 按照掃描方向的不同:正向匹配和逆向匹配 按照長度的不同:最大匹配和最小匹配 1.1

最大匹配 , 大數據 , 中文分詞 , NLP , 數據倉庫 , 未登錄詞 , 搜索分詞器和索引分詞器

收藏 評論

mb69410ac31213c - 華為雲Flexus AI智能體,讓每家企業都擁有開箱即用的AI超能力

AI落地的最後一公里,卡在"用不起來" 2024年,不談AI的企業已被時代拋下。但真正試過的人都知道:大模型很強,落地很難。招不到AI工程師、搞不懂複雜參數、擔心數據泄露、算力成本燒不起……這些痛點讓90%的企業在智能化門口徘徊。Flexus AI智能體的出現,正是要撕掉"高門檻"的標籤——無需開發經驗,無需鉅額投入,20+款經過華為雲驗證的行業Agent,一鍵部署即可讓A

大數據 , 數據 , 數據倉庫 , 調優 , 模態

收藏 評論

mob64ca14040d22 - 什麼是收錄索引名稱

seo與檢索密不可分相接,檢索是排行的基本,沒檢索就必須沒排行,選用科學研究的方式查尋儘量精確的百度收錄狀況,是人們從業seo的基礎工作中。如何查尋百度收錄?方式各種各樣,提議各種各樣方法綜合性應用。某些簡易的方法均可查詢系統的實際檢索總數,包含但是不限於應用百度搜索引擎命令,網頁搜索資源服務平台數據庫索引量小工具,普遍的seo查尋小工具等。 一、

搜索引擎 , 大數據 , 數據倉庫 , 什麼是收錄索引名稱 , 百度 , 數據庫索引

收藏 評論

vivo互聯網 - vivo Celeborn PB級Shuffle優化處理實踐

作者: vivo 互聯網大數據團隊-Wang Zhiwen、Cai Zuguang vivo大數據平台通過引入RSS服務來滿足混部集羣中間結果(shuffle 數據)臨時落盤需求,在綜合對比後選擇了Celeborn組件,並在後續的應用實踐過程中不斷優化完善,本文將分享vivo在Celeborn實際應用過程中對遇到問題的分析和解決方案,用於幫助讀者對相似問題進行參

大數據 , 私藏項目實操分享 , shuffle , RSS , 數據倉庫 , Celeborn

收藏 評論

u_14767244 - SelectDB 在 AWS Graviton ARM 架構下相比 x86 實現 36% 性價比提升

在海量數據分析中,追求高性價比已成為各大企業的主流趨勢。ARM 架構憑藉其高能效和低成本的特點,逐漸在數據中心崛起,成為理想的高性價比選擇。基於 ARM 架構的 AWS Graviton 系列處理器,正是這一趨勢的典型代表。Graviton 處理器不僅在計算性能上表現優異,同時顯著降低了運行成本,尤其在數據密集型任務中展現出明顯優勢。與傳統的 x86 架構處理器相比,Graviton 提

AWS , 大數據 , 數據倉庫 , 性能比較 , 數據處理

收藏 評論

u_14767244 - Apache Doris 在小米統一 OLAP 和湖倉一體的實踐

小米早在 2019 年便引入 Apache Doris 作為 OLAP 分析型數據庫之一,經過五年的技術沉澱,已形成以 Doris 為核心的分析體系,並基於 2.1 版本異步物化視圖、3.0 版本湖倉一體與存算分離等核心能力優化數據架構。本文將詳細介紹小米數據中台基於 Apache Doris 3.0 的查詢鏈路優化、性能提升、資源管理、自動化運維、可觀測等一系列應用實踐。

大數據 , 數據 , 運維 , 數據倉庫 , 物化視圖

收藏 評論

colddawn - DB where 字段 is null 會走索引嘛

1.對查詢進行優化,要儘量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。 2.應儘量避免在 where 子句中對字段進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描,如: select id from t where num is null 最好不要給數據庫留NULL,儘可能的使用NO

字段 , 大數據 , 存儲過程 , 數據倉庫 , bc

收藏 評論

u_15444077 - 從random隨機數看驗證碼重複數字

本文分享自天翼雲開發者社區《從random隨機數看驗證碼重複數字》.作者:王****淋 ## 推導: 1. 有6個不同數字 - (0個重複數字: 1+1+1+1+1+1): $$p(6) = C_{10}^6 * 6! \div 10^6$$ 2. 有5個不同數字 - (某個數字重複了2次: 1+1+1+1+2): $$p(5) = (\

大數據 , 數據倉庫

收藏 評論

Aloudata - 企業級 VS 個人級:智能問數的“集團軍”與“單兵作戰”的差異解析

智能問數正迅速成為企業數據消費的新入口。從初創公司到世界 500 強,眾多組織嘗試通過“一句話問數”的方式,降低數據分析門檻、提升決策效率。理想很豐滿,但現實很骨感,“問不準”、“不靈全”、“問不深”成為大量嚐鮮用户的普遍感受。 表面上看,這類失敗常被歸因於技術瓶頸——例如模型準確性不足、SQL 生成錯誤、響應延遲等。但深入剖析後不難發現,問題的根

大數據 , 數據倉庫 , 智能歸因 , 智能報告 , 數據分析 , 智能問數 , chatbi

收藏 評論

u_14767244 - 深入理解 Doris Variant:如何讓 JSON 查詢性能追平列存,還能承載萬列索引字段?|Deep Dive

摘要:在如 Snowflake、ElasticSearch、ClickHouse.... 等傳統系統中,對於 JSON 的處理往往面臨靈活性及性能無法兼得的困境,而 Apache Doris 的 VARIANT 類型,通過動態子列、稀疏列存儲、延遲物化和路徑索引等能力,實現了靈活結構 + 列存性能的平衡。本文將對該能力的實現一一講解,全面展示其優勢。 在大數據時代,JSON 已

大數據 , 數據 , 數據倉庫 , 結構化 , Json

收藏 評論

u_14767244 - 從 Flink 到 Doris 的實時數據寫入實踐——基於 Flink CDC 構建更實時高效的數據集成鏈路

Flink-Doris-Connector 作為 Apache Flink 與 Doris 之間的橋樑,打通了實時數據同步、維表關聯與高效寫入的關鍵鏈路。本文將深入解析 Flink-Doris-Connector 三大典型場景中的設計與實現,並結合 Flink CDC 詳細介紹了整庫同步的解決方案,助力構建更加高效、穩定的實時數據處理體系。 一、Apache Doris 簡介 A

數據同步 , 大數據 , 數據 , 數據倉庫 , apache

收藏 評論

阿里雲大數據AI技術 - EMR Serverless Stella 1.0 技術分享:StarRocks企業級版本內核重大突破

在今年雲棲大會上,EMRServerlessStella1.0正式發佈,這是一款面向企業級場景深度優化的高性能數據分析引擎。阿里雲開源大數據平台OLAP引擎負責人周康系統性地分享了Stella在存算分離架構、Lakehouse場景以及全文檢索等三大核心場景下的深度優化經驗,為業界提供了大規模OLAP系統工程化實踐的寶貴參考。Stella引擎的發佈將為企業級用户提供更加專業、高效的

大數據 , 數據倉庫 , 阿里雲 , Lakehouse , starrocks , Stella , olap

收藏 評論