tag 語義化

標籤
貢獻1
31
05:07 AM · Nov 22 ,2025

@語義化 / 博客 RSS 訂閱

蛋先生DX - RAG 切片利器 LumberChunker 是如何智能地把文檔切割成 LLM 愛吃的塊

丹尼爾:蛋兄,問個問題唄。RAG 裏的文檔應該怎麼切割比較好呢?按固定的字符數或詞數?按句?按段落?加個重疊窗口?感覺這些都太簡單粗暴,容易把相關的內容給拆散了 蛋先生:恩,你説得對。這些方法一刀切,確實沒辦法考慮上下文的語義關係。現在大模型越來越強大,完全可以藉助它們的能力,比如 LumberChunker 丹尼爾:LumberChunker? 蛋先生:這個名字起得非常有意思。"Lumber"

llm , ai開發 , 語義化 , 人工智能 , 文檔

收藏 評論