tag 分塊

標籤
貢獻5
58
09:58 AM · Nov 21 ,2025

@分塊 / 博客 RSS 訂閱

合合信息解決方案 - 文檔分塊時,如何避免把表格或關鍵段落割裂?

在 RAG 知識庫構建、大模型文檔問答等場景中,文檔分塊是影響信息檢索準確性與回答質量的關鍵環節,而表格與關鍵段落的割裂問題,已成為行業普遍面臨的核心痛點,其難點集中體現在三方面: ● 複雜元素結構識別難:真實場景中的文檔往往包含雙欄表格、無線圖表、跨行合併表格、嵌套表格等非標準化元素,傳統 OCR 工具無法精準判斷這些複雜元素的結構邏輯與內容順序,分塊時易將完

機器學習 , 分塊 , 上傳 , 人工智能 , 嵌套

收藏 評論

DeepSeaAI - RAG(檢索增強生成)分類與開發框架

RAG(檢索增強生成)分類與開發框架 概述 RAG(Retrieval-Augmented Generation)是一種結合檢索機制與大型語言模型的技術範式,通過從外部知識源檢索相關信息來增強生成模型的準確性和可靠性。 一、RAG 分類體系 1. 按架構分類 類型 特點 適用場景

數據集 , 分塊 , pytorch , 人工智能 , 開發框架

收藏 評論

wx65950818d835e - 17: 超分中的圖像塊處理技術

引言 在圖像超分辨率(SR)任務中,尤其是高分辨率圖像重建任務中,圖像塊處理技術(Patch-Based Methods)被廣泛應用。圖像塊處理技術將圖像分解成多個小塊,通過對每個小塊的超分重建,提高了整體圖像重建的精度。這種方法在處理大尺寸圖像時具有明顯優勢,因為它能夠在細節恢復時保持圖像的局部一致性。本文將討論圖像塊處理技術在超分中的應用及其優勢。 圖像塊處理技術

分塊 , 圖像重建 , c++ , 後端開發 , 恢復能力 , c

收藏 評論

代碼天地 - RAG落地實踐:知識庫三層架構和關鍵組件

在當前LLM(大型語言模型)的應用浪潮中,檢索增強生成(RAG)已成為相對成熟且應用最廣的落地模式之一。但無論是從最初的Naive RAG演進到Advanced RAG,還是最新的Agentic RAG,其核心都離不開一個關鍵底座:知識庫管理系統。 對於面向落地應用RAG的產品經理和工程化技術人員而言,如果只是停留在對LLM能力或RAG流程的表面理解,很難在真實複雜的業務場

分塊 , 三層架構 , 服務器 , 知識管理 , 分佈式

收藏 評論

小怪獸會微笑 - Every Token Counts: Generalizing 16M Ultra-Long Context in Large Language Models(超長文本模型論文HSA)

Every Token Counts: Generalizing 16M Ultra-Long Context in Large Language Models(超長文本模型論文HSA) 這篇論文介紹了 HSA-UltraLong,這是一個基於 分層稀疏注意力(Hierarchical Sparse Attention, HSA) 機制的模

分塊 , redis , 語言模型 , 自然語言處理 , 點積 , 數據庫 , 人工智能

收藏 評論