動態

詳情 返回 返回

雲棲實錄 | AI 搜索智能探索:揭秘如何讓搜索“有大腦” - 動態 詳情

演講主題:AI 搜索智能探索——基於AI搜索開放平台的Agentic Search算法技術揭秘

在全球AI技術快速迭代的背景下,信息檢索與搜索技術正迎來革命性突破。

9月26日,雲棲大會AI搜索與向量引擎分論壇上,阿里雲智能集團高級技術專家——徐光偉深度解析了基於AI搜索開放平台的Agentic Search算法技術體系,並結合技術架構演進與商業化實踐,展示了阿里雲在向量模型優化、多模態檢索、DeepSearch/DeepResearch等領域的創新成果。
image.png

AI搜索趨勢的演進:從靜態檢索到動態智能

徐光偉指出,AI搜索技術經歷了三個關鍵階段:傳統智能搜索(全網/垂類/雲端搜索)——RAG 增強搜索(結合大模型生成能力)——快速發展的 Agentic Search(代理式動態搜索)。

Agentic Search 通過大模型自主決策“何時、何地、如何”執行搜索任務,可完成複雜任務規劃等操作。徐光偉強調,阿里雲AI搜索開放平台實現了三階段技術的融合,在保留傳統搜索高效性的同時,通過大模型賦能動態任務執行,為客户提供全棧式解決方案。
image.png

技術亮點一:低維高效向量模型,平衡性能與成本

針對向量檢索中高維度帶來的存儲與計算壓力,阿里雲實現套娃 Adaptor 技術,通過在 Embedding 模型後添加輕量級 MLP 映射層,在無監督場景下將向量維度壓縮至 512 維的同時保持近似完整向量的精度。

實測數據顯示,在存在有監督數據時該技術在客户場景中實現 Recall@1指標提升超 10 個百分點。目前,向量降維服務與定製化模型訓練能力已集成至 OpenSearch 產品,支持企業按需調用。
image.png

技術亮點二:多模態檢索能力升級,覆蓋多樣化場景

面對圖片、視頻等非結構化數據的快速增長,阿里雲自研並開源 Ops-MM-embedding 模型,在 MMEB 榜單中達到開源模型領先水平。

該模型通過三階段訓練(跨模態對齊、難負樣本挖掘、領域數據微調)及 Ensemble 優化,顯著提升文本-圖像/視頻的跨模態檢索精度。
例如:

  • 電商圖搜:支持多主體識別,可在一張圖片中定位多個商品並精準匹配相似結果。
  • 視頻檢索:支持長視頻關鍵時刻的精準定位,實現秒級直達用户所需內容。

多模態檢索技術已經在多個領域展現出巨大價值。在零售電商中,通過圖像理解與多主體識別,用户可以“以圖找貨”,快速匹配相似商品;在視頻處理場景中,可以通過語義檢索精準定位到視頻中的目標畫面,實現秒級直達。

結合 OpenSearch 提供的電商圖搜與視頻精準定位能力,企業可實現商品拍攝搜、視頻關鍵幀索引等場景應用。這類應用不僅大幅提升了檢索的準確性與響應速度,還帶來更直觀、高效的交互體驗,為電商推薦、體育賽事分析、影視版權管理等提供了強大動力支撐。
image.png

技術亮點三:NL2SQL技術突破,提升自然語言查詢能力

在自然語言搜索領域,阿里雲 OpenSearch-SQL 為用户帶來了“所問即所得”的交互體驗。

阿里雲 OpenSearch-SQL 技術通過四模塊協同架構(預處理、信息抽取、生成、優化)及多輪一致性對齊策略,有效緩解傳統 NL2SQL 中的模型幻覺問題。該方案在公開 BIRD 榜單中取得領先成績,並已應用於金融、政務等領域數據庫查詢場景。相關論文被 SIGMOD 會議收錄,核心代碼同步開源。

阿里雲 OpenSearch-SQL 為企業數據庫檢索、業務分析、即席查詢等場景提供了高效、易用、低門檻的解決方案,讓非技術用户也能直接從自然語言獲取精準數據洞察。
image.png

技術亮點四:DeepSearch與DeepResearch,複雜任務處理的智能體系統

針對深度搜索與科研級複雜需求,阿里雲構建了 Agentic Search 智能體系統,其核心技術亮點包括:

  1. 動態規劃與多工具協同:通過 Retrieval Router、Retrieval Agents 及 MCP工具鏈,實現任務分解、多輪工具調用與結果修正;
  2. 多層級 Memory 系統:引入 Memory LLM 插件,在客户數據上微調小型模型,輔助大模型理解垂直場景,複雜問題解決率提升33%;
  3. 全流程自動化:從背景調查、任務規劃到報告生成,系統支持動態迭代與糾錯,已在科研文獻分析、金融盡調等場景落地。

這些能力讓 AI 搜索不僅能“找答案”,還能“做研究”,真正執行從信息收集、加工到輸出的一條龍任務。
image.png

在 Deep Search/Research 的執行過程中,阿里雲將任務處理拆分為背景調查—規劃執行—報告生成三個階段。這一流程確保了從用户提問到成果產出的全過程可控、精確與高效,特別適合多步推理和複雜研究類任務。具體流程圖如下:
image.png

在權威基準評測中,阿里雲 Deep Search/Research 展現了強大的跨任務適應性和複雜問題處理能力。無論是在多輪深度檢索任務(BrowseComp)、多跳推理任務(HotpotQA),還是綜合搜索評估(Xbench-DeepSearch)中,該方案都穩居行業前列,並較傳統單步 RAG 模式實現大幅性能提升。這證明了其在任務分解、多工具協作、記憶驅動推理等創新機制上的顯著優勢,為科研分析、競爭情報、深度數據研究等高難度應用場景提供了更高準確率與更穩健的解決方案。
image.png

在實際應用中,阿里雲 Deep Search/Research 不僅能完成多步信息檢索與深度分析,還能將推理鏈路全過程透明化展示,並生成結構化、多格式的成果報告。從推理步驟和工具調用,到 Markdown 文本和可視化圖表,再到網頁端交付,整個過程實現了 從任務分解 → 數據分析 → 多端成果交付 的閉環。

這種全鏈路能力,使其在商業調研、市場分析、科研報告等場景中,既保證了分析過程的可追溯性,又提升了結論呈現的專業度與可用性。

技術驅動場景:全棧能力助力行業智能化升級

阿里雲搜索技術體系的核心價值在於技術深度與場景廣度的結合:

  1. 生態共建:持續在 HuggingFace、GitHub 等平台輸出 Ops-MM-embedding 模型、OpenSearch-SQL工具鏈等核心能力;
  2. 產品化能力:OpenSearch 平台集成向量檢索、多模態搜索、智能推薦等全棧功能,服務超10萬企業客户,日均處理搜索請求超50億次;
  3. 行業賦能:未來將進一步深化大模型與搜索技術的融合,助力醫療、法律、智能製造等領域實現智能化升級。

結尾

“AI搜索已從‘信息匹配’邁向‘智能決策’,阿里雲將持續通過技術創新與產品化能力,為企業構建下一代智能信息獲取系統。”

阿里雲 AI 搜索的演進,展示了搜索領域從關鍵詞匹配 → 語義理解 → 多模態融合 → 多 Agent 協作研究的技術飛躍。
無論是精準的電商圖搜、智能化的視頻搜索、多源異構的數據整合,還是深度多步的分析研究,Agentic Search 都能為用户帶來更高效、更智能、更貼合需求的結果。面向未來,AI 搜索是企業和個人應對信息洪流的智能導航儀,也即將進入真正的、智慧搜索時代。

user avatar cafebabe 頭像 edonsoft 頭像 fabarta 頭像
點贊 3 用戶, 點贊了這篇動態!
點贊

Add a new 評論

Some HTML is okay.