隨着大模型時代到來,用户需求從“關鍵詞匹配”轉向“自然語言交互與問答式搜索”。2025年9月26日,杭州雲棲大會“AI搜索與向量引擎”分論壇上,金山辦公雲搜索技術總監——陳海榮宣佈,其核心產品WPS雲文檔搜索功能結合阿里雲搜索引擎完成重大升級,正式邁入3.0時代。
此次升級以阿里雲Elasticsearch混合檢索與AI語義搜索能力為核心,全面解決海量文檔場景下的檢索效率、語義理解與成本優化難題,為全球6.32億月活用户提供“秒級響應、語義直達”的智能搜索體驗。
關於金山辦公
金山辦公(Kingsoft Office)是全球領先的辦公軟件、服務與解決方案提供商,旗下產品包括WPS Office、金山文檔等,服務全球超6.32億月活用户,覆蓋220多個國家和地區,致力於以技術創新推動辦公智能化轉型。
深耕技術迭代:從基礎架構到語義搜索的跨越
作為擁有2625億雲文檔、服務全球220餘個國家和地區的企業級應用,WPS雲文檔搜索功能歷經三次技術革新。早期版本面臨“搜不到、排不準、響應慢”等挑戰:1.0版本通過自研QU引擎、分詞器及高亮算法,將首屏點擊率從53.7%提升至69.8%,MRR(平均倒數排名)翻倍至0.52;2.0版本依託阿里雲ES索引優化、跨集羣網關等技術,實現查詢P99延遲<350ms,集羣穩定性顯著提升,支撐千億級文檔規模下的高效檢索。
金山辦公雲搜索技術總監陳海榮指出:“用户不再侷限於文件名檢索,而是希望輸入‘項目Q3營收數據’或‘公司規章制度’等語義指令,直接獲取結構化答案。”這一轉變推動WPS搜索進入3.0時代。
阿里雲技術賦能:混合檢索與AI原生架構
在3.0版本中,金山辦公聯合阿里雲Elasticsearch構建“語義搜索+向量檢索”的混合技術架構,實現三大突破:
- 文檔AI原生化:通過多維度AI解析引擎,對文檔內容進行語義標籤化處理,提升文檔理解深度;
- Query意圖精準識別:基於大模型的自然語言處理能力,實現搜索意圖分流,支持“全庫問答”“文檔關聯檢索”等場景;
- 冷熱數據智能管理:依託阿里雲ES冷熱索引策略,將向量檢索內存資源需求降低70%、CPU消耗減少50,同時通過自動化的寫入/查詢Pipeline,實現業務無感的高效成本控制。
以實際場景為例,用户輸入“新人如何申請休假”時,系統可自動關聯公司制度文檔並提取關鍵流程;輸入“項目A季度總結”時,AI直接從相關文檔中抽取數據生成摘要,真正實現“告別盲找,一步直達答案”。
未來展望:AI搜索生態的全球佈局
金山辦公與阿里雲的深度合作,不僅優化了搜索技術架構,更重塑了智能辦公場景的用户體驗。未來,雙方計劃進一步融合多模態檢索、實時協同搜索等能力,並拓展至企業知識庫管理、跨語言文檔檢索等全球化場景。
“阿里雲Elasticsearch的混合檢索能力與技術前瞻性,是支撐WPS搜索持續領先的關鍵。”陳海榮表示。作為企業級搜索領域的標杆案例,WPS雲文檔的技術升級為行業提供了可複用的智能化升級路徑——從底層架構優化到上層語義交互創新,阿里雲持續以“技術+場景”雙輪驅動,賦能企業構建下一代智能搜索生態。