tag 向量

標籤
貢獻10
72
05:59 PM · Nov 05 ,2025

@向量 / 博客 RSS 訂閱

deephub - 向量搜索升級指南:FAISS 到 Qdrant 遷移方案與代碼實現

FAISS 在實驗階段確實好用,速度快、上手容易,notebook 裏跑起來很順手。但把它搬到生產環境還是有很多問題: 首先是元數據的問題,FAISS 索引只認向量,如果想按日期或其他條件篩選還需要自己另外搞一套查找系統。 其次它本質上是個庫而不是服務,讓如果想對外提供接口還得自己用 Flask 或 FastAPI 包一層。 最後最麻煩的是持久化,pod 一旦掛掉索引就沒了,除非提前手動存盤。 Q

llm , 向量 , 人工智能 , 檢索系統

收藏 評論

Zilliz - 向量數據庫入坑指南:初識 Faiss,如何將數據轉換為向量(一)

我們日常使用的各種 APP 中的許多功能,都離不開相似度檢索技術。比如一個接一個的新聞和視頻推薦、各種常見的對話機器人、保護我們日常賬號安全的風控系統、能夠用哼唱來找到歌曲的聽歌識曲,甚至就連外賣配送的最佳路線選擇也都有着它的身影。 相信很多同學是第一次聽説它,或者只知道它的大名,而不知該如何使用它。本篇文章,我們就來聊聊 faiss,分享這個“黑科技”是如何發揮神奇的“魔法”的。 寫在前面 fa

相似度 , 向量 , 相似度檢測 , 數據庫 , meta

收藏 評論

阿里雲大數據AI - 朝陽永續基於阿里雲 Milvus 構建金融智能投研產品“AI 小二”

一、客户簡介 朝陽永續是先進的金融數據與智能服務提供商,致力於為基金管理公司、證券研究機構及專業投資者提供高質量、精準和全面的數據分析與決策支持工具。依託多年深耕金融行業的數據積累與投研經驗,朝陽永續推出其核心產品——AI小二,一款融合大模型技術的AI金融投研智能體。 AI小二基於生成式AI能力,結合阿里雲向量檢索服務Milvus版(簡稱阿里雲Milvus),打造了集“智能問答、極速研究、深度分析

milvus , 向量 , 阿里雲 , 數據庫

收藏 評論

科技之巔 - 【高考/拋物線/向量】已知O為座標原點,點(1,1)在拋物線C:x^2=2px(p>0)上,過點B(0,-1)的直線交C與P、Q兩點,則?(2022全國新高考I卷數學卷第11題)

【問題】 已知O為座標原點,點(1,1)在拋物線C:x^2=2px(p0)上,過點B(0,-1)的直線交C與P、Q兩點,則: A.C的準線為y=-1 B.直線AB與C相切 C.|OP|•|OQ||OA|^2 D.|BP|•|BQ||BA|^2 【答案】 BCD 【出處】 2022年普通高等學校招生全國統一考試(全國新高考I卷)

高考 , 拋物線 , 數學 , 向量 , 代碼人生

收藏 評論

Zilliz - 向量數據庫入坑指南:使用 Faiss 實現一個最簡單的向量檢索功能 (二)

上一篇內容中,我們瞭解了什麼是 Faiss,以及如何將文本內容轉換為向量數據。本篇文章中,我們來使用 Faiss 實現向量檢索功能。 使用 Faiss 實現最簡單的向量檢索功能 接下來,我們將使用 Faiss 實現一個小功能,針對哈利波特小説全集內容,接觸向量檢索技術,完成相似內容搜索的功能。與我們使用 “CTRL+F” 或者把數據倒入 MySQL,使用 “%LIKE%” 去進行全文匹配不同,我們

相似度 , 向量 , 相似度檢測 , 數據庫 , meta

收藏 評論

DashVector - 如何通過Python SDK刪除Collection中已存在的Doc

本文介紹如何通過Python SDK,根據ID或ID列表刪除Collection中已存在的Doc。 説明 如果指定id不存在,則刪除對應Doc的操作無效。 前提條件 已創建Cluster 已獲得API-KEY 已安裝最新版SDK 接口定義 Python示例: Collection.delete( ids: Union[str, List[str]], partiti

向量 , 數據庫 , 大模型

收藏 評論

向量檢索 - 如何通過HTTP API獲取Doc

本文介紹如何通過HTTP API,根據id列表獲取Collection中已存在的Doc。 説明 如果指定id不存在,則該id對應的Doc為空。 前提條件 已創建Cluster:創建Cluster。 已獲得API-KEY:API-KEY管理。 Method與URL HTTP

大數據 , yyds乾貨盤點 , 數據倉庫 , 向量 , AI , 數據庫 , 大模型

收藏 評論

老紀的技術嘮嗑局 - OceanBase 向量索引優化指南

物格而後知至。 ——《禮記》 楔子 OceanBase 最近發佈了 seekdb 數據庫,主打 “輕量 + 向量 + AI”。 在 seekdb 發佈之後,陸續收到了許多用户關於 seekdb 中向量索引在使用上的一些問題,比如:索引創建耗時慢優化問題,創建時對內存的要求,增量達到什麼規模需要重建,重建性能影響怎麼消除等等等等。 因此,向量索引的研發同學夏進大佬,今天就專門在這篇文章中,從 Oc

索引 , 向量

收藏 評論

墨天輪 - 墨天輪沙龍 | Proxima 劉方:阿里巴巴大規模向量檢索實時服務化引擎 Proxima SE

導讀 隨着 AI 技術的廣泛應用,以及數據規模的不斷增長,向量檢索也逐漸成了 AI 技術鏈路中不可或缺的一環。 在11月16日舉辦的【墨天輪數據庫沙龍-向量數據庫專場】邀請到阿里巴巴高級技術專家劉方,為大家帶來《阿里巴巴大規模向量檢索實時服務化引擎Proxima SE》主題分享,以下為演講實錄。 劉方 阿里巴巴高級技術專家 阿里巴巴達摩院Proxima-SE產品負責人,多

阿里巴巴 , 向量 , 數據庫

收藏 評論

Momodel - ColBERT——以詞元級別的向量嵌入提升信息檢索效果

介紹 檢索增強一代 (RAG) 自成立以來就風靡全球。RAG 是大型語言模型 (LLM) 提供或生成準確和事實答案所必需的。我們通過RAG解決LLM的事實性,我們嘗試為LLM提供一個與用户查詢上下文相似的上下文,以便LLM將處理此上下文並生成事實正確的響應。我們通過以向量嵌入的形式表示我們的數據和用户查詢並執行餘弦相似性來做到這一點。但問題是,所有傳統方法都以單個嵌入表示數據,這對於良好的檢索系統

llm , 向量 , 編碼 , 人工智能 , 檢索系統

收藏 評論

KerryWu - 向量數據庫 - 索引

1. HNSW索引 分層可導航小世界 1.1. 定義 HNSW(Hierarchical Navigable Small World,分層可導航小世界)的核心思想是構建一個分層圖結構: 分層結構:每個數據點隨機分配一個層級,層級越高的數據點越少。 小世界圖:每層是一個“鄰接圖”,每個點只和部分點相連,圖結構保證“短路徑”導航。 導航:從高層開始,逐層向下搜索,逐步接近目標點。 生活類比

索引 , 向量

收藏 評論

阿里雲大數據AI - 雲棲實錄|阿里雲 Milvus:AI 時代的專業級向量數據庫

在大模型與人工智能迅猛發展的今天,我們正處在一個“數據爆炸”的時代。據IDC統計,2025年全球數據總量將達到175ZB,其中超過90%為圖片、視頻等非結構化數據。這些數據藴藏着巨大的商業價值,但如何高效存儲、檢索並挖掘其深層語義信息,成為企業面臨的核心挑戰。 而這一切的關鍵,正是——向量化。 無論是圖像特徵提取,還是大語言模型對自然語言的理解,都依賴於將原始數據轉化為高維向量。隨着AI應用的普及

milvus , 向量 , 阿里雲

收藏 評論

DashVector - 如何通過Python SDK向Collection中插入或更新Doc

本文介紹如何通過Python SDK向Collection中插入或更新Doc。 説明 若調用本接口時Doc Id已存在,則等同於更新Doc; Doc Id不存在,則等同於插入Doc。 若調用本接口時不指定Doc Id,則等同於插入Doc,DashVector會自動生成Doc Id,並在返回結果中攜帶id信息。 前提條件 已創建Cluster 已獲得API-KEY 已安裝最

向量 , 數據庫 , 人工智能 , 大模型

收藏 評論

阿里雲大數據AI - 為什麼 OpenSearch 向量檢索能提速 13 倍

在當今的數字化時代,以音視頻等多媒體內容為代表的非結構化數據呈現出爆炸式增長。這類數據無法簡單地用傳統數據庫中的行列數據來表示,因此向量檢索技術應運而生。非結構化數據通常被轉換為向量表示,並存儲在向量數據庫中。這種向量化模型能夠提取並捕捉到數據中的特徵,在多維的向量空間中進行有效表示。 一個形象的例子是:embedding(king)−embedding(man)+embedding(wom

向量 , 阿里雲 , 檢索系統

收藏 評論

DashVector - 如何通過Python SDK更新Collection中已存在的Doc

本文介紹如何通過Python SDK更新Collection中已存在的Doc。 説明 若更新Doc時指定id不存在,則本次更新Doc操作無效 如只更新部分屬性fields,其他未更新屬性fields默認被置為None Python SDK 1.0.11版本後,更新Doc時vector變為非必填項 前提條件 已創建Cluster 已獲得API-KEY 已安裝最新版SDK 接口定義

向量 , 數據庫 , 人工智能 , 大模型

收藏 評論