一、前言 "知識圖譜作為結構化知識的代表,正在深刻改變我們獲取和利用信息的方式。” 在本文中,我們將從基礎概念出發,首先解析知識圖譜的本質——它如何以『實體-關係-屬性』的形式組織海量信息,使機器能夠像人類一樣理解世界的關聯性。 接着,我們將探討知識圖譜在搜索引擎中的應用,看看它如何幫助Google實現從『關鍵詞匹配』到『語義理解』讓搜索更智能、更精準。 而在當今大模型時代,知識圖譜與RAG(
前面教程中,我們學習到了如何構建 RAG 系統,以及對 RAG 系統進行效果提升、速度優化、功能擴展等等方面。 本教程我們將在此基礎上進一步介紹最近很火的Agentic RAG,它是RAG的變種,但更加智能,讓我們開始吧! 如果把RAG比作帶着書本去考試的考生,那麼Agentic RAG就是同時帶着老師和書一起去考試的考生! Agentic RAG 就是整合了 AI Agent 的 R
在大模型全面走向工程落地的當下,LazyLLM正式與硅基流動(SiliconFlow) 達成深度合作,共同打造面向開發者的下一代智能應用底座。藉助LazyLLM的一鍵接入線上模型API能力,硅基流動的大語言模型、多模態模型、向量與Embedding模型、文生圖模型等已經完整接入,同一套接口即可覆蓋從文本到圖像、從檢索到生成的全鏈路需求。 這次合作帶來的不僅是更強大的RAG選型,還進一步放大
在多模態大模型迅速發展的今天,我們已經能讓模型"看圖説話",甚至"讀懂表格",但要讓模型真正理解複雜的文檔結構(例如在PDF中準確識別章節、表格、公式與圖像的邏輯關係)依然是一個未被徹底解決的問題。 UniParse正是為此而生:它是一款面向AI應用的通用文檔解析工具 ,旨在將文檔中的非結構化內容轉化為結構化語義信息,使多模態模型能夠高效、精準地理解和利用文檔內容。 本文將從技術視角介紹U
在之前的教程中,我們主要探討了個人級 RAG(檢索增強生成)應用的實現方式和優化技巧。 但在企業級應用中,知識管理和智能檢索的需求更為複雜,涉及多個部門,各自具備獨立的業務領域、數據存儲方式和算法需求。因此,高效管理和檢索知識,確保不同部門靈活訪問知識庫,同時滿足數據隔離、安全性和共享機制,是企業級知識管理系統的核心挑戰。 本章將介紹如何使用 LazyLLM 快速構建面向企業級的數據庫管
在前面的課程中,我們利用所學的 RAG 知識,搭建了一個基於論文的問答系統。但是當論文數量比較多時,針對一些統計信息,比如某個方向的論文數量、某個會議的論文數量等,如果只通過傳統的 RAG 是沒辦法對這些信息進行檢索的。 對此,本章將先簡單回顧之前內容,並在此基礎上再做升級,完成一個集統計分析和知識問答功能於一體的智能問答系統。 一、上節回顧 為了更好地理解本章內容,我們先簡要回顧前兩
本章我們將為大家介紹如何利用RAG解決統計問題。 首先介紹傳統RAG在處理統計問題中的缺陷:無法直接處理結構化數據以及缺乏動態計算能力,然後我們介紹了RAG解決統計問題的基本思路,以及通過SQL Call和Function Call機制。 接下來分別介紹二者,首先介紹SQL的相關概念以及如何構建SQL數據庫,然後介紹Text2SQL技術和sql_tool工具的具體實現。 最後介紹Fun
在前面的課程中,我們學習了 RAG 相關的知識,以及如何自定義 Reader 組件和在 RAG 任務中處理圖片和表格數據。本節內容將在此基礎上,利用前面學到的知識,搭建一個基於論文的問答系統。 在信息爆炸的時代,科研論文的數量激增,研究人員在查閲文獻時面臨諸多挑戰。論文內容專業性強、邏輯複雜,傳統的關鍵詞檢索方式難以精準提取核心信息,導致獲取有效內容的成本較高。 為了解決這一問題,RAG技術被廣泛
在前面的課程中,我們探討了RAG(Retrieval-Augmented Generation)的基本原理及其在純文本處理中的應用。RAG 通過從外部知識庫檢索相關信息,結合上下文生成更準確、信息豐富的回答,從而提升基於文本的問答系統能力。 然而,現實世界中的信息並不侷限於文本,例如 PDF 文檔中的圖片、表格等多模態數據也承載着大量有價值的知識。在某些情況下,這些圖文並茂的內容比純文本更直觀、
在開發知識問答助手的過程中,常見的挑戰之一就是如何讓智能體記住之前的對話和交互內容。 很多應用在實現多輪問答時,會遇到信息丟失或上下文混亂的問題:用户提過的問題、提供的數據、甚至助手之前的回答都無法被系統持續記憶,導致體驗斷層。對於企業級知識庫或面向用户的個人助手來説,這種缺失不僅影響回答的準確性,也使得智能體難以形成長期價值。 構建一個能夠記憶的問答系統,並非簡單地將對話記錄寫入數據庫。 智能
在當今數據驅動的時代,表格數據作為信息承載的重要形式,廣泛存在於各類商業場景中。從財務報表到保險理賠單,從銷售記錄到客户信息,表格無處不在。表格不僅僅是文本的堆砌,它包含着複雜的空間邏輯關係。如何讓機器真正理解表格數據?這是金融、財務、保險等領域智能化轉型的關鍵挑戰。 本文將深入探討表格解析的數據準備和模型訓練全流程,為讀者呈現一套完整可行的解決方案。 數據準備:質量決定上限 數據準備是整個表格解
上一期我們向大家介紹了商湯自研的智能文檔解析 UniParse,歡迎大家試用!本期開始,我們將對 UniParse 中涉及的技術點進行逐一拆解,希望能幫助大家更好地理解和使用我們的產品~ 本期和下期的分享主題都將圍繞“表格解析”展開,技術細節,一探究竟! 什麼是表格解析 表格解析是將非結構化的表格圖像(如掃描文檔、照片或PDF中的表格)轉為機器可讀、可理解的結構化數據的過程。具體而言,它旨在將圖像