博客 / 列表

商湯萬象開發者 - LazyLLM教程 | 第19講:高階RAG:基於知識圖譜的RAG

一、前言 "知識圖譜作為結構化知識的代表,正在深刻改變我們獲取和利用信息的方式。” 在本文中,我們將從基礎概念出發,首先解析知識圖譜的本質——它如何以『實體-關係-屬性』的形式組織海量信息,使機器能夠像人類一樣理解世界的關聯性。 接着,我們將探討知識圖譜在搜索引擎中的應用,看看它如何幫助Google實現從『關鍵詞匹配』到『語義理解』讓搜索更智能、更精準。 而在當今大模型時代,知識圖譜與RAG(

教程 , 知識 , 人工智能 , 開源 , llama

商湯萬象開發者 - LazyLLM教程 | 第18講:高階RAG:Agentic RAG

前面教程中,我們學習到了如何構建 RAG 系統,以及對 RAG 系統進行效果提升、速度優化、功能擴展等等方面。 本教程我們將在此基礎上進一步介紹最近很火的Agentic RAG,它是RAG的變種,但更加智能,讓我們開始吧! 如果把RAG比作帶着書本去考試的考生,那麼Agentic RAG就是同時帶着老師和書一起去考試的考生! Agentic RAG 就是整合了 AI Agent 的 R

機器學習 , 自然語言處理 , 教程 , 知識 , 人工智能

商湯萬象開發者 - LazyLLM × 硅基流動:共造面向開發者的下一代智能應用底座

在大模型全面走向工程落地的當下,LazyLLM正式與硅基流動(SiliconFlow) 達成深度合作,共同打造面向開發者的下一代智能應用底座。藉助LazyLLM的一鍵接入線上模型API能力,硅基流動的大語言模型、多模態模型、向量與Embedding模型、文生圖模型等已經完整接入,同一套接口即可覆蓋從文本到圖像、從檢索到生成的全鏈路需求。 這次合作帶來的不僅是更強大的RAG選型,還進一步放大

應用開發 , 資訊 , 部署 , 合作 , 人工智能

商湯萬象開發者 - UniParse:讓多模態模型真正“讀懂”文檔的解析引擎

在多模態大模型迅速發展的今天,我們已經能讓模型"看圖説話",甚至"讀懂表格",但要讓模型真正理解複雜的文檔結構(例如在PDF中準確識別章節、表格、公式與圖像的邏輯關係)依然是一個未被徹底解決的問題。 UniParse正是為此而生:它是一款面向AI應用的通用文檔解析工具 ,旨在將文檔中的非結構化內容轉化為結構化語義信息,使多模態模型能夠高效、精準地理解和利用文檔內容。 本文將從技術視角介紹U

llm , 文檔分析 , 教程 , 內容管理 , 人工智能

商湯萬象開發者 - LazyLLM教程 | 第17講:企業級RAG:權限、共享與內容安全的全鏈路方案

在之前的教程中,我們主要探討了個人級 RAG(檢索增強生成)應用的實現方式和優化技巧。 但在企業級應用中,知識管理和智能檢索的需求更為複雜,涉及多個部門,各自具備獨立的業務領域、數據存儲方式和算法需求。因此,高效管理和檢索知識,確保不同部門靈活訪問知識庫,同時滿足數據隔離、安全性和共享機制,是企業級知識管理系統的核心挑戰。 本章將介紹如何使用 LazyLLM 快速構建面向企業級的數據庫管

llm , 教程 , 知識 , 數據庫 , 人工智能

商湯萬象開發者 - LazyLLM教程 | 第16講:實戰:打造具備宏觀問答與圖表生成功能的論文問答的RAG系統

在前面的課程中,我們利用所學的 RAG 知識,搭建了一個基於論文的問答系統。但是當論文數量比較多時,針對一些統計信息,比如某個方向的論文數量、某個會議的論文數量等,如果只通過傳統的 RAG 是沒辦法對這些信息進行檢索的。 對此,本章將先簡單回顧之前內容,並在此基礎上再做升級,完成一個集統計分析和知識問答功能於一體的智能問答系統。 一、上節回顧 為了更好地理解本章內容,我們先簡要回顧前兩

機器學習 , 教程 , 知識 , 人工智能 , SQL

商湯萬象開發者 - LazyLLM教程 | 第15講:大視角問答:RAG如何支持跨文檔、跨維度總結

本章我們將為大家介紹如何利用RAG解決統計問題。 首先介紹傳統RAG在處理統計問題中的缺陷:無法直接處理結構化數據以及缺乏動態計算能力,然後我們介紹了RAG解決統計問題的基本思路,以及通過SQL Call和Function Call機制。 接下來分別介紹二者,首先介紹SQL的相關概念以及如何構建SQL數據庫,然後介紹Text2SQL技術和sql_tool工具的具體實現。 最後介紹Fun

llm , 教程 , 知識 , 人工智能 , SQL

商湯萬象開發者 - LazyLLM教程 | 第14講:實戰:構建一個支持複雜學術論文問答的RAG系統

在前面的課程中,我們學習了 RAG 相關的知識,以及如何自定義 Reader 組件和在 RAG 任務中處理圖片和表格數據。本節內容將在此基礎上,利用前面學到的知識,搭建一個基於論文的問答系統。 在信息爆炸的時代,科研論文的數量激增,研究人員在查閲文獻時面臨諸多挑戰。論文內容專業性強、邏輯複雜,傳統的關鍵詞檢索方式難以精準提取核心信息,導致獲取有效內容的成本較高。 為了解決這一問題,RAG技術被廣泛

論文 , 教程 , 知識 , 系統架構 , 人工智能

商湯萬象開發者 - LazyLLM 教程 | 第 13 講:RAG + 多模態:圖片、表格通吃的問答系統

在前面的課程中,我們探討了RAG(Retrieval-Augmented Generation)的基本原理及其在純文本處理中的應用。RAG 通過從外部知識庫檢索相關信息,結合上下文生成更準確、信息豐富的回答,從而提升基於文本的問答系統能力。 然而,現實世界中的信息並不侷限於文本,例如 PDF 文檔中的圖片、表格等多模態數據也承載着大量有價值的知識。在某些情況下,這些圖文並茂的內容比純文本更直觀、

llm , 算法 , 教程 , 人工智能 , 開源

商湯萬象開發者 - LazyLLM x MemU:20 行代碼打造有長記憶的知識問答

在開發知識問答助手的過程中,常見的挑戰之一就是如何讓智能體記住之前的對話和交互內容。 很多應用在實現多輪問答時,會遇到信息丟失或上下文混亂的問題:用户提過的問題、提供的數據、甚至助手之前的回答都無法被系統持續記憶,導致體驗斷層。對於企業級知識庫或面向用户的個人助手來説,這種缺失不僅影響回答的準確性,也使得智能體難以形成長期價值。 構建一個能夠記憶的問答系統,並非簡單地將對話記錄寫入數據庫。 智能

科技 , 人工智能 , 開源 , llama , dify

商湯萬象開發者 - 技術拆解 | 表格解析(下):從數據準備到模型訓練的全流程實戰詳解

在當今數據驅動的時代,表格數據作為信息承載的重要形式,廣泛存在於各類商業場景中。從財務報表到保險理賠單,從銷售記錄到客户信息,表格無處不在。表格不僅僅是文本的堆砌,它包含着複雜的空間邏輯關係。如何讓機器真正理解表格數據?這是金融、財務、保險等領域智能化轉型的關鍵挑戰。 本文將深入探討表格解析的數據準備和模型訓練全流程,為讀者呈現一套完整可行的解決方案。 數據準備:質量決定上限 數據準備是整個表格解

llm , 文檔

商湯萬象開發者 - 技術拆解 | 表格解析(上):企業數字化與AI應用流程中的重要基礎支撐

上一期我們向大家介紹了商湯自研的智能文檔解析 UniParse,歡迎大家試用!本期開始,我們將對 UniParse 中涉及的技術點進行逐一拆解,希望能幫助大家更好地理解和使用我們的產品~ 本期和下期的分享主題都將圍繞“表格解析”展開,技術細節,一探究竟! 什麼是表格解析 表格解析是將非結構化的表格圖像(如掃描文檔、照片或PDF中的表格)轉為機器可讀、可理解的結構化數據的過程。具體而言,它旨在將圖像

表格 , 人工智能 , 檢索系統 , 文檔