面試現場:戰五渣勇闖互聯網大廠 面試官(推了推眼鏡,面無表情):請坐。我們開始吧。 戰五渣(緊張地搓手):好、好的!我準備好了! 第一輪:基礎技術棧考察(Spring Boot + Web + 構建工具) 面試官:你們項目用什麼構建工具?為什麼選它? 戰五渣:Maven!因為……公司都用這個,我也跟着用。(撓頭)
企業在智能化升級的浪潮中,知識問答和智能客服的需求不斷激增。然而,傳統的 RAG 方案往往依賴外部向量庫,導致架構複雜、數據同步困難和高昂的運維成本。 本方案將基於雲原生數據庫 PolarDB 構建 RAG 智能知識系統,融合原生 IMCI 向量索引與 PolarDB for AI 能力,通過原生 SQL 調用列存向量節點和 AI 節點,無需外部向量庫,實現數據與知識的閉環
寫在前面:要想做一個比較好RAG系統,我認為還是在數據收集和清洗上下一點功夫。因為要想檢索有效 - 你能提供給模型更有價值的信息。現有chunk的方法有很多,但是我試了很多種(包括一些基於大量規則的),最後發現很難適配多樣化的數據集(針對不同來源,比如論文、內部資料)。 基於這個思路,我想的是讓LLM本身來切分文檔。優點