博客 / 詳情

返回

阿里雲 AI 搜索開放平台:從算法到業務——AI 搜索驅動企業智能化升級

——已獲知乎作者【GitHub Daily】授權轉載

目前大模型的強大能力,使其成為一些企業和行業的主要創新驅動力,企業亟需重新審視和調整現有的創新機制,以適應AI技術和大數據的快速發展。目前很多企業已經開始嘗試大模型在業務中進行賦能,但在使用一些大模型時往往因為自身場景的需求不同,導致在應用落地中存在一些場景受限,知識庫不完善等一些痛點。

阿里雲AI搜索,憑藉先進的大模型能力和強大的 RAG 處理技術,為企業提供全場景、高智能、低門檻的搜索服務解決方案,不管是金融還是電商,不管是教育還是醫療,都可以根據自身行業的一些需求進行定製化的服務。從而更高效構建適合自身企業的大模型應用,實現業務智能化升級。

一.阿里雲 AI 搜索開放平台介紹

儘管 AI 搜索在效果上取得了顯著進步,但是在某些垂直領域的應用還是存在一些不足,尤其在對知識準確性要求極高的業務場景中更為突出。此外,高成本和隱私安全可控性低也是實施過程中面臨的重要挑戰。

為應對這些問題,阿里雲 Elasticsearch 推出了創新的 AI 搜索方案,使用 RAG 技術對檢索增強生成的各個環節進行能力增強,並深度融合了企業版 AI Assistant,將 RAG 技術應用於 AI搜索領域。

1.1什麼是 RAG 技術?

簡單來説,RAG 技術是通過先從海量數據中精準檢索相關信息,再將這些信息與用户查詢融合,最後利用生成模型基於增強後的上下文生成準確回答,從而提升語言模型在特定任務中的表現,確保信息的實時性和準確性,廣泛應用於智能客服、知識管理等領域。

1.2 阿里雲 RAG 有何不同

1.2.1 Elasticsearch 向量性能5倍提升

Elasticsearch是利用硬件加速技術在文本向量檢索領域,尤其是處理複雜相似度計算任務時,提高計算性能的一種工具。它的運用旨在將複雜的相似度計算簡單化。從最初的利用高維向量計算到後面利用 knn 來進行過濾,到查詢緯度增至2028,文本計算和搜索性能都在有效的提升,但隨着企業不同的需求,文本數據的日益增長,對於性能的要求也越來越高。

Elasticsearch 通過向量量化技術,將 float32 位量化為 int8,所需內存僅為原先需求的四分之一,並利用諸如稀疏編碼技術,能夠基於原始詞彙建立索引,有效擴展至與其相關的概念或詞彙,每項擴展均附有模型計算出的權重,增強了語義理解的深度和廣度。

1.2.2 RAG 模塊組件化

RAG(檢索增強生成)是大模型應用的重要方向,它需要在生成回答之前,通過之前收集的知識庫進行整合匹配,結合上下文的提示,使生成的回答結果準確。

因此 RAG 需要一套完成的流程進行知識庫的構建。

我們通過上面的框架可以看到,一套完善的 RAG 流程需要很多的模塊,從數據的處理,搜索引擎,再到大模型的生成,這對於普通的開發者和企業來説是很困難的。

阿里雲AI搜索針對這些環節,通過將服務以組件化的方式進行開放,使不同的企業和垂直場景可以靈活的進行使用。它涵蓋了數據層,引擎層,搜索層到應用層的全鏈路能力。

1.2.3 強大的大模型技術

為了滿足用户對更高效、更智能搜索功能的需求,阿里雲 AI 搜索開放平台新增加 QwQ 模型,這一全新模型的加入將為企業和開發者帶來更強大的搜索解決方案。

基於 Qwen2.5-32B 模型訓練的 QwQ 推理模型,強化學習大幅度提升了模型推理能力。模型數學代碼等核心指標(AIME 24/25、LiveCodeBench)以及部分通用指標(IFEval、LiveBench等)達到 DeepSeek-R1 滿血版水平,各指標均顯著超過同樣基於 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。

如何體驗其強大的搜索能力,只需兩步:

  • 登錄並開通 阿里雲 OpenSearch-AI 搜索開放平台;

  • 選擇 qwq 模型,同時可輸出深度思考內容。

二、AI 搜索技術賦能企業智能化

再好的技術也需要經過實踐才能證明其強大之處,阿里雲AI搜索技術為企業提供了高效、智能的信息獲取解決方案。其定製化的搜索結果和智能化服務,極大地提升了企業的工作效率和決策質量,助力企業實現智能化轉型。

2.1 搜索引擎讓電商搜索更準確

以電商板塊為例,如果一個電商平台面臨海量商品信息和用户查詢需求時,傳統的搜索方式就難以滿足其快速、精準的檢索需求。

但無論對於平台方還是電商賣家(B端企業),都可以通過引入阿里雲AI搜索來提升自己店鋪商品的搜索準確率和曝光率。

以下是通過阿里雲AI搜索針對電商行業算法版進行一些的個性化優化:

在阿里雲 OpenSearch-行業算法版控制枱中我們可以選擇“行業算法版”,行業類型選擇“電商行業”,其他配置信息與通用行業模板配置相同:

在購買電商行業算法服務之後,我們就可以根據自己店鋪的一些商品數據進行查詢分析,排序側拉和周邊服務等。

具體怎麼使用了官方附有專門的操作指南,我在此做個簡單的整理:

在實例管理-->應用列表中找到對應的應用單擊“配置”,配置應用需要依次按照如下步驟進行:功能選擇-->應用結構-->索引結構-->數據源-->完成。

應用結構的創建有4種方式:通過數據源創建,手動創建,模板上傳和文檔上傳,下面以通過數據源創建為例進行説明

  • 應用結構配置:

  • 索引結構配置:

  • 填寫數據源配置信息:

通過以上的配置我們就完成了阿里雲 AI 針對電商行業的算法後台配置,如果你要測試效果:

搜索測試:索引構建完成後可在功能擴展>搜索測試頁面對電商行業算法版的行業文本分析器對應的索引進行測試,例如:牛肉。

假如你搜索的是牛肉,算法會根據你提供的數據源數據,進行精確的匹配,並將最接近的商品結果進行排序呈現。阿里雲AI通過一站式的算法優化,從語義理解,排序,搜索引導等相關的升級,使用户在搜索商品時搜的更準,曝光的商品更優質。

2.2 加快金融數智化轉型

據新聞報道,招商銀行已在多個業務場景廣泛應用阿里雲通義千問大模型,包括智能投研助手“招銀智庫 AI 小研”、智能客服、通用辦公、全行級知識庫等。

以智能投研助手“AI 小研”為例,它依託招行最大的研究資源平台“招銀智庫”,利用阿里雲通義千問大模型,搭建全站智能問答機器人、Chat 研報和熱點聚焦等功能,解決了傳統投研過程中信息檢索難、研報提煉複雜、分析耗時等問題,實現金融語義的精準理解和生成,大幅提升查詢效率和投研精度,並自動化生成熱點摘要與專業科普知識,顯著提高了工作效率和決策質量,成為金融科技領域的重要創新。

2.3 開放搜索助攻教育搜題

在日常學習中,常常會在解題過程中遇到各種困難,尤其是面對複雜的公式時,更是感到無從下手。這時候 AI 搜題就可以助你一臂之力。但是目前一些AI搜題針對與公式解析,文檔識別仍存在一些不確定的誤差,導致最終的結果總是差強人意。

阿里雲AI搜索在教育領域具備高性能向量檢索引擎和先進算法模型,能實現精準快速響應,結合語義向量召回與關鍵字搜索提升搜題準確率,支持多模態輸入適應不同教學場景,可提供定製化解決方案,擁有彈性擴展和高可靠性,通過數據驅動不斷優化,並緊跟技術發展保障安全與隱私,為教育搜索帶來全面優質體驗。

某在線教育平台,主打 K12 教育,用户數千萬級別,題庫量8千萬左右且持續增加,由自建題庫和第三方題庫兩部分組成,之前通過 OCR+自建 ES 搜索服務實現拍照搜索功能,面臨的主要問題是搜索準確率待優化提升,降低搜索延遲等問題。開放搜索接入後:

  • 搜題準確率絕對值提升5%;
  • 延時從100 ms -300 ms 降到穩定50 ms;
  • 離線數據同步大於4000 TPS。

搜題 Query:“張慧研所指與小磁大概相近的是樂府之音”

搜題 Query:“如圖是由一些相同的小正方體搭成的幾何體從三個不同方向看得到的形狀圖,則搭成這樣的幾何體需要__個小正方體. 0 A 3 從上面看看從正面看”

通過升級 阿里雲 AI 搜索開放平台。開放搜索集成了教育搜題行業專屬的教育分詞器,同時在此基礎之上用户還可上傳自己的分詞詞條定製個性化的分詞器。讓搜題結果更準確。

從技術架構再到應用場景,不得不説阿里雲 AI 搜索開放平台的功能的確強大。阿里雲 AI 搜索憑藉高性能向量檢索引擎和先進算法模型,為AI 搜索奠定了堅實的技術基礎。

智能客服,電商優化,數據智能化等場景,阿里雲 AI 搜索正在以技術為基石,以場景作為價值,賦能各行各業,加速企業數字化轉型。如果你的企業也需要一些定製化的服務和更智能化的垂直大模型,我建議可以試試!

快速體驗:https://help.aliyun.com/zh/open-search/search-platform/getting-started/ai-getting-started?spm=5176.29330531.J_2017351270.3.456d466cjW92hK

user avatar
0 位用戶收藏了這個故事!

發佈 評論

Some HTML is okay.