LightRAG:新一代 RAG 系統,更輕量、更快速
在生成式 AI 領域,檢索增強生成(RAG)系統已成為提升大型語言模型(LLM)效能的重要工具。然而,傳統 RAG 系統存在著資料表示方式扁平、缺乏上下文感知等限制,導致產生的回答往往不夠全面且難以捕捉複雜的關聯性。為了突破這些瓶頸,香港大學資料科學實驗室推出了 LightRAG,一種結合知識圖譜和嵌入式檢索系統的創新 RAG 框架,旨在提供更輕量、更快速且更精確的資訊檢索。
LightRAG 的核心優勢:圖譜索引與雙層檢索
LightRAG 的兩大賣點是基於圖譜的索引機制和雙層檢索框架。圖譜索引利用實體識別和知識圖譜建構,將文件中的實體和關係映射出來,形成一個結構化的知識網絡。這個知識圖譜不僅包含實體本身的資訊,還記錄了實體之間的關聯,讓模型能夠更好地理解上下文。
而雙層檢索框架則針對不同類型的查詢,提供更精確的檢索結果。對於特定、細節性的查詢,系統會從知識圖譜的個別節點和邊緣中提取資訊,提供詳細的局部資訊。對於需要更廣泛的主題或抽象概念的查詢,系統則會整合來自多個實體的資訊,提供更全面的全局視角。
LightRAG 如何運作?
LightRAG 的索引流程大致分為以下幾個步驟:
- 文件分割: 將原始文本分割成更小、更易於管理的段落或句子。
- 實體與關係抽取: 使用 LLM 識別文本中的實體(如人名、日期、地點等)及其之間的關係,建立知識圖譜。
- 鍵值對生成: 利用 LLM 分析提取出的實體和關係,為每個實體節點和關係邊緣生成結構化的鍵值對,方便後續檢索。
- 向量嵌入: 將鍵值對中的值(Value)轉換為向量嵌入,儲存到向量資料庫中。
- 去重: 合併重複的實體和關係,優化圖譜結構,提高檢索效率。
在查詢階段,LightRAG 首先從使用者查詢中提取關鍵詞,然後根據關鍵詞的類型和查詢的需求,選擇低層或高層檢索模式。低層檢索針對局部查詢,從個別節點和邊緣中提取資訊;高層檢索則針對全局查詢,整合來自多個實體的資訊。透過結合關鍵詞匹配和知識圖譜的結構化資訊,LightRAG 能夠更精準地檢索到相關內容,提供更符合使用者需求的答案。
LightRAG 的優勢與應用
相較於傳統 RAG 系統,LightRAG 具有以下優勢:
- 更高的檢索準確性: 透過知識圖譜和雙層檢索框架,LightRAG 能夠更好地理解上下文,提供更精確的檢索結果。
- 更快的檢索速度: 基於圖譜的索引機制和向量嵌入技術,LightRAG 能夠快速定位相關資訊,提高檢索效率。
- 更低的成本: 透過減少不必要的 API 呼叫和降低計算資源消耗,LightRAG 能夠有效降低成本。
- 更強的可擴展性: LightRAG 能夠輕鬆整合新的知識,並支援漸進式更新,確保系統在快速變化的資料環境中保持有效性。
LightRAG 在法律、金融、醫療等領域具有廣闊的應用前景。例如,在法律領域,LightRAG 能夠協助律師快速檢索相關法條和案例,提高工作效率;在金融領域,LightRAG 能夠幫助分析師從海量資訊中提取關鍵資訊,做出更明智的投資決策;在醫療領域,LightRAG 能夠協助醫生快速查找相關文獻和病例,提供更精確的診斷和治療方案。
TokenTracker 工具:監控與管理 Token 消耗
LightRAG 還提供了一個名為 TokenTracker 的工具,用於監控和管理大型語言模型的 Token 消耗。這個工具對於控制 API 成本和優化效能非常有用,可以幫助開發者更有效地利用 LLM 資源。
總結
LightRAG 是一個結合知識圖譜和嵌入式檢索系統的創新 RAG 框架,它透過圖譜索引和雙層檢索機制,有效提升了資訊檢索的準確性、速度和效率。LightRAG 的出現,為 RAG 系統的發展帶來了新的方向,也為各行各業的應用提供了更強大的支援。隨著技術的進步,我們可以期待 LightRAG 在未來發揮更大的作用。
參考閱讀
- https://github.com/HKUDS/LightRAG
- https://lightrag.github.io/
- https://arxiv.org/abs/2410.05779
- https://medium.com/@sahin.samia/lightrag-retrieval-augmented-generation-with-graph-based-insights-2473d7f6fd33