博客 RSS 訂閱

得物技術 - 得物自研DSearch3.0搜索核心引擎升級之路

一、背景 隨着交易和社區搜索業務穩步快跑,基建側引擎越來越複雜,之前搜索底層索引查詢結構已經存在較為嚴重的性能瓶頸。成本和運維難度越來越高。在開發效率上和引擎的穩定性上,也暴露出了很多需要解決的運維穩定性和開發效率短板。而在引擎的業務層部分也需要逐步升級,來解決當前引擎中召回層和業務層中各個模塊強耦合,難維護,迭代效率低下等問題。 二、引擎開發技術方案 DSearch1.0索引層整體結構 DSe

搜索引擎

收藏 評論

阿里雲大數據AI - 企業級AI搜索解決方案:阿里雲AI搜索開放平台

隨着信息技術的飛速發展,搜索引擎作為信息獲取的重要工具,扮演着不可或缺的角色。阿里雲 AI 搜索開放平台以其強大的技術支持和靈活的開放性,持續為用户提供高效的搜索解決方案。 一、阿里雲 AI 搜索開放平台 一站式的 AI 搜索開放平台作為阿里雲 AI 搜索整個產品體系核心,提供豐富的 AI 搜索組件化服務。兼容主流開發框架 LangChain和 LlamaIndex,支持搜索專屬大模型、百鍊等大模

搜索引擎 , 大數據 , 雲計算 , 阿里雲 , 人工智能

收藏 評論

阿里雲大數據AI - PAI-LangStudio x AI搜索開放平台 x ElasticSearch: 構建AI Search RAG全棧應用

本文詳細介紹瞭如何使用 PAI-LangStudio 和 Qwen3 構建基於AI搜索開放平台 x ElasticSearch 的 AI Search RAG 智能檢索應用。該應用通過使用 AI 搜索開放平台、ElasticSearch 全文檢索+向量檢索引擎的混合檢索技術配合阿里雲最新發布的 Qwen3 推理模型編排在一個 Agentic Workflow 中,為客户提供了業內領先的 AI Se

大數據處理 , 數據挖掘 , 搜索引擎 , 人工智能 , 深度學習

收藏 評論

得物技術 - 社區搜索離線回溯系統設計:架構、挑戰與性能優化|得物技術

一、項目背景 在社區場景中,我們積累了豐富的用户互動數據。這些歷史互動信息對CTR/CVR預估建模具有重要參考價值,用户的每次互動都反映了其特定維度的偏好特徵。當前,已在多個業務實踐中驗證,基於用户歷史互動特徵進行未來行為預測是有效的。用户互動序列越長,包含的偏好特徵就越豐富,但同時也帶來了更大的技術挑戰。 目前社區搜索領域已經在序列建模方向取得了一些應用成果,顯著提升了搜索效率,但在該方向上仍有

搜索引擎

收藏 評論

極限實驗室 - 搜索百科(1):Lucene —— 打開現代搜索世界的第一扇門

大家好,我是 INFINI Labs 的石陽。 這是《搜索百科》專欄系列文章,每天 5 分鐘,帶你速覽一款搜索相關的技術或產品,同時還會帶你探索它們背後的技術原理、發展故事及上手體驗等。 搜索技術看似專業,但它早已深度融入我們的日常生活。無論是電商搜索、知識檢索,還是 AI 語義搜索、RAG、向量檢索,背後都有經典與新興技術的結合。希望這個系列能幫大家建立更清晰的認知,也歡迎留言交流。 引言:為什

搜索引擎 , lucene

收藏 評論

極限實驗室 - 搜索百科(2):Apache Solr — 企業級搜索的開源先鋒

大家好,我是 INFINI Labs 的石陽。 歡迎回到 《搜索百科》 專欄!每天 5 分鐘,帶你速覽一款搜索相關的技術或產品,同時還會帶你探索它們背後的技術原理、發展故事及上手體驗等。 上一篇我們認識了搜索技術的基石 Apache Lucene,今天我們將繼續這個旅程,瞭解基於 Lucene 構建的第一個成功商業級搜索平台 —— Apache Solr。 Solr 是什麼? Solr 是一款極

搜索引擎 , lucene , solr

收藏 評論

得物技術 - 大模型如何革新搜索相關性?智能升級讓搜索更“懂你”|得物技術

一、背 景 你是否曾在社區搜索時遇到這樣的困擾:想找一雙“平價學生黨球鞋”,結果出現的多是限量聯名款?或者輸入“初冬輕薄通勤羽絨服”,卻看到厚重登山款?這類“搜不準”的情況,正是搜索相關性技術要解決的核心問題——讓搜索引擎更準確地理解用户意圖,返回真正匹配的結果。今天,我們就來揭秘得物如何用大模型技術讓搜索變得更“聰明”。 搜索相關性,即衡量搜索結果與用户查詢的匹配程度,通俗來説就是“搜得準不準”

社區 , 搜索引擎 , 算法 , 大模型

收藏 評論

沉着的牙膏 - AI驅動·全鏈路監測·精確防護:構建新一代政務數據安全平台

一、概要 隨着政務數字化轉型的加速,政務數據安全面臨着前所未有的挑戰。數據安全不僅關乎公眾的隱私和權益,更是確保政務服務高效運行的基礎。為了更好地應對數據安全風險,本方案提出了一種基於全知科技的政務數據安全監測平台,該平台通過AI驅動、全鏈路監測和精準識別的技術特性,實現了對政務數據的全生命週期安全管控。平台在無干擾政務服務的同時,精準識別各種潛在的風險,從而有效地保障了數據安全與合規要求的

深度學習

收藏 評論

青否Ai - 數字人直播爆火,但90%的人沒搞懂這件事,選擇靠譜的數字人源頭廠商比較重要!

降本增效、永不“塌房”、24小時不下播……數字人直播的誘惑越來越大,但坑也多得超乎想象。 “一年成本只要一兩千塊,和真人主播幾萬塊的月薪相比,簡直是九牛一毛!”一位剛試水數字人直播的電商賣家如此感慨。隨着AI技術迅猛發展,數字人直播因其低成本、無“塌房”風險、可全天候工作的特點,迅速成為電商從業者和創業者的新寵。 當前技術下,數字人直播效果已無限接近真人:能自動講解商品、根據關鍵詞回覆

機器學習 , 算法 , 人工智能 , 深度學習

收藏 評論

青否Ai - 降本增效新選擇:用AI數字人主播,打造你的數字人分身線上直播間!

你是否遇到過這樣的場景 深夜,辦公室裏燈火通明。你和你的團隊成員,還在為明天的直播腳本絞盡腦汁,反覆排練,只為那幾小時的完美出鏡。 或者,看着飛速發展的短視頻風口,你深知必須入局,打造個人或品牌IP,但一想到要頻繁面對鏡頭,組織語言,處理複雜的拍攝和剪輯,一股無形的壓力便撲面而來。 又或者,你算了一筆賬:聘請一個專業的主播團隊,高昂的薪資、漫長的培訓、狀態的不穩定……成本與效果之

機器學習 , 算法 , 人工智能 , 深度學習

收藏 評論

憂鬱的吐司 - 數字人直播爆火,但90%的人沒搞懂這件事,選擇靠譜的數字人源頭廠商比較重要!

降本增效、永不“塌房”、24小時不下播……數字人直播的誘惑越來越大,但坑也多得超乎想象。 “一年成本只要一兩千塊,和真人主播幾萬塊的月薪相比,簡直是九牛一毛!”一位剛試水數字人直播的電商賣家如此感慨。隨着AI技術迅猛發展,數字人直播因其低成本、無“塌房”風險、可全天候工作的特點,迅速成為電商從業者和創業者的新寵。 當前技術下,數字人直播效果已無限接近真人:能自動講解商品、根據關鍵詞回覆

機器學習 , 算法 , 人工智能 , 深度學習

收藏 評論

阿里雲大數據AI - PAI Physical AI Notebook 詳解 1:基於 Isaac 仿真的操作動作數據擴增與模仿學習

PAIPhysicalAINotebook詳解1:基於Isaac仿真的操作動作數據擴增與模仿學習 PhysicalAI是AI技術演進的一個熱門話題,目的是基於Transformer、Diffusion等主流大模型結構,訓練得到可以在實際物理空間中指導機器人本體完成各種任務的AI模型。 在PhysicalAI模型的開發過程中,需要用到遙操採集、數據合成、數據增強、模仿學習、模型測評等多個過程,也會用

人工智能 , 深度學習

收藏 評論

憂鬱的吐司 - 雙十一狂歡購物節到了,數字人直播成為商家手中的“帶貨王炸”!

一年一度的雙十一狂歡購物節已經拉開帷幕。踏入各大電商平台的店鋪直播間,會看到一些主播彷彿擁有無窮精力,連續直播數十小時仍神采奕奕。 他們不僅對產品特點進行細緻入微的講解,還能實時與新進入直播間的觀眾流暢互動。然而,只要稍加留意屏幕角落,便能發現一行小字——“AI生成”。原來,這些看起來與真人別無二致的主播,實則是人工智能打造出的。 一、突破極限:24 小時流量收割機(青否數字人源頭v

機器學習 , 算法 , 人工智能 , 深度學習

收藏 評論

拓端tecdat - 電動化智能化雙輪破局 | 2025中國汽車產業趨勢深度洞察報告|附300+份報告PDF、數據、繪圖模板彙總下載

原文鏈接:https://tecdat.cn/?p=44204 原文出處:拓端抖音號@拓端tecdat 2023年,北京車主李女士換車時還在糾結燃油車與混動的油耗差異;2025年,她的鄰居已開着L2+級電動車實現自動避障接送孩子——這兩年,中國汽車產業正經歷“燃油退潮、智能崛起”的顛覆性轉型。這種轉型並非偶然:政策端“雙碳”目標持續發力,技術端電池成本下降超60%,消費端新能源滲透率從20

機器學習 , 數據挖掘 , 算法 , 人工智能 , 深度學習

收藏 評論

星星上的柳樹 - DFT 籤核精通指南

1、DFT 籤核為何至關重要? DFT 籤核確保 IC 設計滿足所有測試能力(testability)要求,為製造後測試提供基礎保障。通過完善的籤核流程,可提前發現問題、減少 costly 迭代,提升產品質量與可靠性。 2、核心籤核技術與實踐經驗 I. 掃描鏈插入與優化 意義:增強 IC 內部狀態的可控性與可觀測性,是高效測試的核心之一; 實踐案例:某領先廠商利用

資訊 , 教程 , 知識 , 人工智能 , 深度學習

收藏 評論

deephub - 從零實現3D Gaussian Splatting:完整渲染流程的PyTorch代碼詳解

3D Gaussian Splatting(3DGS)現在幾乎成了3D視覺領域的標配技術。NVIDIA把它整合進COSMOS,Meta的新款AR眼鏡可以直接在設備端跑3DGS做實時環境捕獲和渲染。這技術已經不只是停留在論文階段了,產品落地速度是相當快的。 所以這篇文章我們用PyTorch從頭實現最初那篇3DGS論文,代碼量控制在幾百行以內。雖然實現很簡潔但效果能達到SOTA水平。 需要説明的是,

pytorch , 人工智能 , 深度學習

收藏 評論

星星上的柳樹 - Timing Signoff 技術精要

1、為何 Timing Signoff 是 IC 設計的“守門人”? Timing Signoff 確保芯片設計在預定時鐘頻率下滿足時序要求,並在多種工況下保持穩定性與可靠性。這是避免後期返工、提升產品良率與質量的重要步驟。 圖:Static Timing Analysis (STA) 流程示意 2、關鍵技術與實踐案例解析 I. 靜態時序分析(STA) STA

資訊 , 教程 , 知識 , 人工智能 , 深度學習

收藏 評論

百川雲開發者 - AI智能客服:你的24小時在線問題解決專家

你是不是也遇到過這樣的情況?半夜遇到產品問題,找客服卻只能看到“工作時間:9:00-18:00”的自動回覆?或者諮詢一個問題,等了半天才收到回覆,結果還是個標準化的“請您耐心等待”? 別急,AI智能客服來了!它不僅能7x24小時在線,還能秒回你的問題,簡直就是貼心小助手。 告別等待,秒回你的問題 想象一下,你正在瀏覽某個產品頁面,對某個功能不太明白。以前你可能得發郵件或等在線客服上線,現在只需要點

人工智能 , 深度學習

收藏 評論

青否Ai - 直播界的變革悄然而至,ai數字人主播佔據直播電商!

企業家走向前台,做網紅帶貨,這已經不是什麼新鮮事了,尤其是那些互聯網公司的企業家們,像雷軍、周鴻禕、餘承東等等。(青否數字人源頭v:zhibo175) 上個月,本身在網絡上擁有極高知名度,對雷軍網絡營銷手段十分佩服的劉強東,突然以另一種方式走向前台,加入廣大直播帶貨隊伍當中。 不過,東哥的直播帶貨不同於俞敏洪、董明珠,而是玩出了新花樣,以AI分身的形態出現,着實給直播界和AI界上了一課

機器學習 , 算法 , 人工智能 , 深度學習

收藏 評論

青否Ai - AI數字人「AI自動播」:一鍵開播,把直播變成“躺賺”!

從“5步折騰”到“1步搞定”,開播效率秒級提升 以前做智能直播,得走“抖音產品授權→寫話術→AI續寫→AI泛化→智能互動設置”至少5步,少則半小時,多則1小時,光流程就把新手嚇退; 現在用「AI自動播」,只要“一鍵掃碼授權抖音”,10秒就能啓動直播,徹底告別反覆操作的麻煩——就算你是第一次做直播,也能“零學習成本”上手! AI自動播 常規模式開播流程繁瑣,至少需要5步:一鍵授權抖音產品 — 一鍵寫

機器學習 , 算法 , 人工智能 , 深度學習

收藏 評論

拓端tecdat - 2025中國快消市場發展趨勢報告:數字化轉型與營銷|附500+份報告PDF、數據模板彙總下載

原文鏈接:https://tecdat.cn/?p=44215 原文出處:拓端抖音號@拓端tecdat 2025年快消行業的“增長焦慮”越來越明顯:新品投了超頭部KOL卻沒爆、KA費用審批等1周錯過旺季、情人節禮贈通投渠道轉化率低迷、四線城市賣高端品佔比僅8%……這些不是某家企業的問題,而是行業共性困境——過去十年線上流量成本漲3倍,KA流程複雜度增2倍,消費者需求從“只看性價比”轉向“場

機器學習 , 數據挖掘 , 算法 , 人工智能 , 深度學習

收藏 評論

老實的剪刀 - 2025中國API安全產品全景解析:廠商排名與發展趨勢

隨着全球數字化轉型的深入,API(應用程序接口)已成為企業業務系統與外部應用、平台之間交互的核心組成部分。API不僅幫助企業實現業務流程的自動化,還為各種創新應用提供了技術基礎。然而,隨着企業越來越依賴API來支持業務發展,API接口的安全性問題也日益突顯。 在傳統的網絡防護體系下,安全重點通常集中在網絡邊界,通過防火牆、入侵檢測等措施來抵禦外部攻擊。然而,在如今的數字化時代,API作為數據

深度學習

收藏 評論

拓端tecdat - Python電動汽車充電網絡優化研究—泊松過程、排隊、貪心算法、模擬退火、聚類、差分演化DE、動態規劃、滾動時域預測控制

全文鏈接:https://tecdat.cn/?p=44226 原文出處:拓端數據部落公眾號 分析師:Zhichao Tong 在“雙碳”戰略推進下,電動汽車保有量激增已成為必然趨勢,而充電網絡的資源閒置、佈局失衡、負荷波動三大問題,正成為制約行業發展的關鍵瓶頸。作為長期服務能源與交通領域的數據分析團隊,我們曾為某省會城市完成充電網絡優化諮詢項目,通過數據建模與算法設計,幫助當地緩解

機器學習 , 數據挖掘 , 算法 , 人工智能 , 深度學習

收藏 評論

deephub - 提升迴歸模型可信度:4種神經網絡不確定性估計方法對比與代碼實現

迴歸任務在實際應用中隨處可見——天氣預報、自動駕駛、醫療診斷、經濟預測、能耗分析,但大部分迴歸模型只給出一個預測值,對這個值到底有多靠譜卻隻字不提。這在某些應用場景下會造成很多問題,比如用模型預測患者血壓,假設輸出是120/80這樣的正常值,表面看沒問題。但如果模型其實對這個預測很不確定呢?這時候光看數值就不夠了。 神經網絡有幾種方法可以在給出預測的同時估計不確定性。 迴歸中的不確定性問題 分類任

神經網絡 , 人工智能 , 深度學習 , Python

收藏 評論