博客 / 詳情

返回

OceanBase 年度發佈會 Hands-on AI Workshop 回顧

簡介

本次 Workshop 是 OceanBase 新品發佈會期間的特別活動,主要關注如何基於 OceanBase seekdb 快速構建 AI 原生應用。活動打破了常規的 PPT 宣講模式,重點在於代碼實操。在來自 LangChain Community、Dify 和 OceanBase 的技術專家指導下,現場數百名開發者在兩小時內,基於 seekdb 實際動手完成了從環境部署、Agentic RAG 搭建到構建具備“長期記憶”智能體的完整開發流程。

現場小夥伴直觀感受到了具備原生 AI 能力的輕量數據庫是如何有效降低應用開發門檻的。本文將詳細回顧這場實戰 Workshop。

一、OceanBase seekdb 介紹

本次 Workshop 的所有實驗均基於 OceanBase seekdb 進行,這是 OceanBase 推出的面向 AI 應用場景的輕量嵌入式數據庫。

解決什麼問題?在目前的 AI 應用開發架構中,開發者通常需要同時維護關係型數據庫(存儲結構化數據)和向量數據庫(存儲非結構化向量數據)。這種架構不僅帶來了較高的數據一致性維護成本,還可能產生跨系統查詢的延遲。seekdb 的設計目標是實現“結構化數據”與“非結構化向量數據”的統一存儲與檢索,並以 1C2G 輕量的方式簡化 AI 應用的數據架構。

二、Workshop 環境配置環境指南

Workshop 的第一個環節是基礎環境配置。現場為了規避 Wi-Fi 網絡高併發可能帶來的延遲,我們為每位參會者都準備了阿里雲 ECS 雲服務器作為實驗環境。以下是本地電腦(Mac/Windows)詳細安裝流程(以 CLI 為主):

  1. Docker (用於三個實驗)
    Mac: 下載 Docker Desktop 並安裝。
    Windows: 同樣下載 Docker Desktop,需開啓 WSL2,安裝後啓動 Docker 應用。
  2. Python 3.10+ (用於三個實驗)
    下載 Python 官方安裝包 進行安裝。
    安裝完成後檢查:
python --version # 應輸出 3.10 或更高
  1. uv (Python 包管理器)
pip install uv
  1. seekdb (用於三個實驗)

我們將使用 Docker 快速啓動一個 seekdb 實例。針對國內網絡環境和不同的芯片架構,提供了相應的鏡像源。

# 獲取docker 鏡像
docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/oceanbase/seekdb:latest
docker tag  swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/oceanbase/seekdb:latest  docker.io/oceanbase/seekdb:latest

# arm機器
docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/oceanbase/seekdb:latest-linuxarm64
docker tag  swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/oceanbase/seekdb:latest-linuxarm64  docker.io/oceanbase/seekdb:latest

# 方式一: docker 方式安裝
docker run -d \
  --name seekdb \
  -p 2881:2881 \
  -v ./data:/var/lib/oceanbase/store \
  oceanbase/seekdb:latest
  1. powermem (用於實驗三)
pip install powermem
  1. Dify(用於實驗二)
git clone https://github.com/langgenius/dify.git
cd dify/docker
docker-compose up -d
  1. Jupyter(用於實驗一)
pip install jupyter
  1. Qoder: 下載: https://qoder.com/download (選擇適合自己的電腦的qoder包下載,請注意 qoder 需要註冊方可使用。)

三、基於 LangChain V1 和 OceanBase seekdb

快速構建 Agentic RAG

講師:LangChain Ambassador 張海立

本實驗基於 LangChain v1 的最新 Agent 構建標準和 OceanBase seekdb 的向量存儲和混合檢索能力,讓 AI 讀懂一份 Nike 2023 財報(PDF),並能回答相關財務問題。 核心邏輯: 文檔切片 -> 存入 seekdb -> 封裝為 Tool -> 綁定 Agent。

  • 將一份非結構化的 Nike 2023 財報 PDF 文檔轉化為計算機可理解的向量數據
  • 通過定義檢索工具並調用 LangChain v1 的 create_agent 接口,打造具備推理能力的 AI Agent。

核心操作步驟

步驟 1:文檔處理與向量化 首先,我們需要將 PDF 文檔加載並切割成適合模型處理的小塊(Chunks)。 在 LangChain 中,我們使用 PyPDFLoader 加載文檔,然後使用 RecursiveCharacterTextSplitter 進行切分。

from langchain_community.vectorstores import OceanBase

# 初始化 OceanBase 向量存儲
docsearch = OceanBase.from_documents(
    documents, 
    embeddings, 
    connection_string="127.0.0.1:2881..."
)

這一步在後台,seekdb 會自動創建一張表,並將文本的向量(Embedding Vector)和原始內容存儲在同一行記錄中。

步驟 2:構建檢索工具 我們將上一步生成的 docsearch 封裝為一個 LangChain Tool。

retriever_tool = create_retriever_tool(
    docsearch.as_retriever(),
    "nike_financial_report",
    "搜索並返回關於 Nike 2023 財報的詳細信息。"
)

注意 description 參數非常重要,LLM 會根據這段描述來判斷何時調用這個工具。

步驟 3:初始化 Agent 並執行 使用 LangChain V1 的 create_tool_calling_agent 接口,將 LLM(如 GPT-4 或通義千問)與我們定義的工具綁定。

詳細步驟請參考:https://ask.oceanbase.com/t/topic/35634850

四、基於 Dify 和 OceanBase,快速構建 AI 應用

講師:鄭立,Sr. Developer Relations, Dify

本實驗旨在驗證 OceanBase seekdb 對 AI 應用的一體化支撐能力。通過部署 seekdb 並修改 Dify 核心配置,將原本分離的向量庫與元數據庫統一替換為 seekdb。在簡化架構的同時,驗證在 RAG 場景下的完整可用性。

核心操作步驟

步驟 1:修改 Docker Compose 配置 進入 Dify 的 docker 目錄,編輯 .env 文件或 docker-compose.yaml。需要將 Dify 的數據庫連接指向我們啓動的 seekdb 容器。

步驟 2:配置向量後端 在 Dify 的系統設置文件或環境變量中,將 Vector Store 的類型指定為 OceanBase。當用户在 Dify 界面上傳知識庫文件時,Dify 會將切片後的向量數據寫入 seekdb 的向量表中。

步驟 3:構建知識庫應用 重啓 Dify 容器組後,進入 Web 界面:

詳細步驟請參考:https://ask.oceanbase.com/t/topic/35634856

五、讓 AI 記住你,基於 OceanBase 構建具備上下文記憶的智能體實踐

講師:湯慶 OceanBase 技術專家

本實驗核心目標是解決 AI 智能體“遺忘”對話上下文的問題。通過集成 OceanBase seekdb 作為向量與結構化數據的混合存儲底座,並使用 PowerMem 進行記憶管理,展示瞭如何讓 AI 擁有“長期記憶”。

步驟 1:部署 PowerMem,Dify + PowerMem MCP 環境集成,我們在 Dify 環境中配置 PowerMem MCP,打通底層記憶通道。這一步也使其具備了訪問 OceanBase seekdb 進行長久記憶存儲與檢索的能力。

步驟 2:Vibe Coding 挑戰,我們將一段提示詞複製到 AI 編程助手 Qoder 中,要求它參照 PowerMem 的官方示例,自動生成一套代碼審查智能體。

詳細步驟請參考:https://ask.oceanbase.com/t/topic/35634483

最後

通過上述三個實驗,我們從不同維度驗證了 OceanBase seekdb 在 AI 應用開發中的實際能力。本次 Workshop 只是一個起點。seekdb 的輕量化和易用性,旨在讓每一位開發者都能在自己的筆記本上,以最低的成本探索 AI 原生應用的開發。

在此,我們要特別緻謝參與本次社區生態共建的開源夥伴,感謝 Dify, LangChain Community, Qoder 的鼎力支持,感謝每一位參與的開發者。

user avatar
0 位用戶收藏了這個故事!

發佈 評論

Some HTML is okay.