大家好,我是 OceanBase 開源團隊的一名研發同學,最近一年緊跟公司的 DATA X AI 戰略在做相關的研發工作,所以今天我就從我自己的視角和大家聊一聊我眼中的 OceanBase 在近期開源的 seekdb、PowerRAG 和 PowerMem 三款產品: seekdb:AI 原生混合搜索數據庫,基於 Apache 2.0 協議開源 PowerRAG:企業級 RAG 解決方案,構
物格而後知至。 ——《禮記》 楔子 OceanBase 最近發佈了 seekdb 數據庫,主打 “輕量 + 向量 + AI”。 在 seekdb 發佈之後,陸續收到了許多用户關於 seekdb 中向量索引在使用上的一些問題,比如:索引創建耗時慢優化問題,創建時對內存的要求,增量達到什麼規模需要重建,重建性能影響怎麼消除等等等等。 因此,向量索引的研發同學夏進大佬,今天就專門在這篇文章中,從 Oc
作者:吳其朋,滴滴分佈式存儲運維負責人 滴滴出行(下文簡稱“滴滴”)作為涵蓋#網約車、#出租車、#順風車、#代駕 等業務的一站式多元化出行平台,擁有全球客户6.5億。自2024年應用OceanBase以來,已在多個場景落地並替換RocksDB、TokuDB,包括網約車增長服務、中台核心歸檔庫、代駕核心歸檔庫、EP、無人車服務等。本文以網約車增長服務、歸檔庫等核心業務為例,闡述滴滴的數據庫技術經驗以
本文又是一篇餵飯級教程,為大家展示通過 OceanBase seekdb 構建 RAG(檢索增強生成)系統的詳細步驟。 RAG 系統結合了檢索系統和生成模型,可根據給定提示生成新文本。系統首先使用 seekdb 的原生向量搜索功能從語料庫中檢索相關文檔,然後使用生成模型根據檢索到的文檔生成新文本。 前提條件 已安裝 Python 3.11 或以上版本 已安裝 uv 已準備好 LLM AP
編者按: 11 月 18 日,2025 OceanBase 年度發佈會在北京舉行,現場發佈並開源了 OceanBase 首款 AI 原生混合搜索數據庫 seekdb(簡稱 seekdb )。 OceanBase 開源生態總經理封仲淹(花名:紀君祥,就是這個公眾號 “老紀的技術嘮嗑局” 裏的話事人 —— 老紀)會在這篇文章中,為大家介紹 OceanBase 開源 seekdb 的初衷。 在 2025
一. 寫作原因 遇到了 3 個事情,讓我想到要好好梳理一下 session id 的相關知識。 發現一個事務中查到的 OceanBase 的 session id 會發生變化(其實也算沒有變,原因下文會説)。 查到的 session id 在使用 kill 命令時候報錯找不到該 ID(不是因為 ID 真的不存在或者變化了)。 通過不同的查詢方式,查到很多和 session id 有關的 I
作者:杜霆,vivo互聯網存儲運維負責人 vivo 是一家以智能終端和智慧服務為核心的科技公司,服務全球 5億+ 用户,公司內分設多條業務線,其中vivo互聯網業務在近兩年內完成底層數據庫方案的升級以更好地支撐業務發展。業務使用OceanBase後,解決了原本的MySQL在大規模數據場景下的存儲與性能使用瓶頸,高併發數據更新效率提升60%,複雜查詢性能提升80%,存儲成本降低50%。 曾支撐數千套
背景 OceanBase 從 4.3.0 版本開始,推出了加速 AP 查詢的列存引擎,具體包含: 新的列式編碼 列預聚合信息 列存執行引擎 向量化內存格式 新的查詢優化器,能根據規則和代價動態選擇行存和列存引擎。 OceanBase 列存引擎發佈之後,AP 分析能力得到了大幅提升,在與一系列競品的對比測試中都有比較好的表現,正式踏入了 HTAP 領域。 為了節省存儲成本和簡化用户的運
本文摘自《OceanBase社區版在泛互場景的應用案例研究》電子書,點擊鏈接即可獲取完整版內容。 作者:湯慶,OceanBase技術專家 引言 在分佈式數據庫領域,OceanBase 憑藉其原生分佈式架構和金融級高可用能力,已成為超大規模數據處理的核心基礎設施。然而,分佈式架構的複雜性也帶來了診斷調優的挑戰。與傳統單機數據庫不同,OceanBase 的故障可能涉及多節點協同、網絡延遲、資源分配不均
作者:Gundy 1. 場景與目標 UGC 社區典型特點:內容量大、更新快、長尾重。推薦系統要同時兼顧“眼下的即時興趣”和“用户的穩定偏好”,並在一次請求內完成多路候選召回與融合,保證毫秒級延遲。 本文給出一套雙向量用户興趣 + 一次 SQL 多路召回的實踐方案,數據庫層使用 OceanBase 原生向量能力,結構化與向量同庫,避免“兩庫同步/一致性坑”。 2. 為什麼選 OceanBase(直
本文摘自《OceanBase社區版在泛互場景的應用案例研究》電子書,點擊鏈接獲取完整版內容。 作者:楊家鑫,多點數據庫團隊DBA 在當今數字化轉型的大潮中,企業面臨着諸多挑戰,尤其是在零售SaaS場景下,數據處理的複雜性和成本問題尤為突出。作為零售數字化領域的先鋒,我們不僅是國內頂尖的全局數字化解決方案提供商,更在亞洲市場上佔據領先地位。我們擁有上百個全渠道系統,涵蓋會員管理、商品、營銷、O2O、
作者: 佐菲,網易個人郵箱數據庫負責人;長樂,網易個人郵箱服務端資深研發 前言 自1997年誕生至今,網易個人郵箱已在互聯網的浪潮中走過了二十餘載,憑藉着卓越的服務與技術實力,發展成為國內乃至全球極具影響力的郵箱品牌。網易旗下擁有六個獨具特色的郵箱域,分別為163、126、yeah、vip163、vip126和vip188,每個郵箱域都精準定位不同的用户羣體,滿足多樣化的需求。 經過多年的積累與拓
作者:楊志豐,OceanBase產品總經理、首席架構師 首先為大家推薦這個 OceanBase 開源負責人老紀的公眾號 “老紀的技術嘮嗑局”,會持續更新和 #數據庫、#AI、#技術架構 相關的各種技術內容。歡迎感興趣的朋友們關注! 本文摘自《OceanBase社區版在泛互場景的應用案例研究》,歡迎點擊鏈接閲讀詳細內容。 綜述 在OceanBase 十餘年的技術演進中,共經歷了三次大的架構升級
楔子 最近看到了一篇極具啓發性的論文:《DeepSeek-OCR: Contexts Optical Compression》, AI 大神 Andrej Karpathy 對 DeepSeek 那篇 DeepSeek-OCR 的論文評價很高,你可能以為他會説:“哇,這個 OCR 模型真厲害,識別率又提升了!” 但他沒有。相反,他幾乎是揮了揮手説:“它是個不錯的 OCR 模型,但這不重要。” 因為
本文摘自《OceanBase社區版在泛互場景的應用案例研究》電子書,獲取完整版內容可直接點擊鏈接。 作者:馬琳,萬家數科數據庫專家。 從性能到擴展性:華潤萬家數據庫系統面臨的挑戰 (一)華潤萬家與萬家數科企業概況 華潤萬家是華潤集團旗下優秀零售連鎖企業,業務覆蓋中國內地及香港市場。面對萬家眾多業務需求和互相關聯的業務環境,集團亟需加強各業務耦合性,以適應線上、線下、物流、財務等各個業務環境的快速發
本文摘自《OceanBase社區版在泛互場景的應用案例研究》電子書,點擊鏈接獲取完整版內容。 作者:高山岩,OceanBase資深技術專家 海量數據日益增長的今天,越來越多的業務系統面臨高併發、高性能訪問的壓力,以至於企業對業務系統的性能保障訴求越來越強烈。數據庫系統作為業務系統的基礎組件,具備高併發、高性能的能力,是支撐業務系統、滿足客户訴求的關鍵。本文通過闡述數據庫組件的設計,解讀做好系統性能
作者:盧文豪,百麗時尚數據庫負責人 百麗時尚集團(以下簡稱百麗)是中國領先的大型時尚鞋服集團,旗下擁有20+ 個鞋服品牌,如#BELLE(百麗)、#TATA(他她)、#TEENMIX(天美意)等,覆蓋了從高端到大眾時尚、功能、運動、潮流等品類,線下門店共計8000+,覆蓋300+城市。作為中國時尚鞋履市場佔有率連續十餘年位居第一的企業,百麗擁有發達的線下銷售網絡,從原料到設計到生產,再到終端零售,
0. 有獎徵文活動 OceanBase 社區正在組織一個以 “OBD 單機部署上手體驗” 為主題的有獎徵文活動,參與方式詳見:https://ask.oceanbase.com/t/topic/35630223。 徵文獎金超級豐厚,具體有多麼豐厚?更多詳情👉「2025 OceanBase 佈道師計劃」 1. 概述 本文主要分享在 Windows 筆記本上的 Linux 子系統 Ubuntu 上部
作者:周強,卡牌遊戲公司高級開發工程師 向量數據庫的獨特優勢與選型經驗 向量數據庫 是專門為存儲、索引和查詢高維向量數據而設計的數據庫系統,能夠高效處理由機器學習模型生成的嵌入向量,並支持基於相似性的快速檢索。 相較於#傳統數據庫,向量數據庫在多方面顯示出其獨有的特性,可在前者涉及的領域之外發揮優勢。如圖1所示,傳統數據庫主要用於存儲結構化數據,基於精準匹配進行查詢,適用於業務數據管理,而向量數據
首先為大家推薦這個 OceanBase 開源負責人老紀的公眾號 “老紀的技術嘮嗑局”,會持續更新和 #數據庫、#AI、#技術架構 相關的各種技術內容。歡迎感興趣的朋友們關注! 本文整理自6月21日“OceanBase 城市交流會 · SQL 遇上 AI ”《度小滿 × OceanBase 實踐:統一架構驅動效率與成本雙突破》,點擊鏈接可觀看視頻回顧。 作者:趙輝,度小滿技術委員會負責人 度