RAG处理流程和graphRAG的优势

进化路线

输入图片说明

RAG处理流程

输入图片说明
该技术通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLMs)。
RAG的“检索、增强、生成”,谁增强了谁,谁生成了答案,主语很重要。是从知识库中检索到的问答对,增强了LLM的提示词(prompt),LLM拿着增强后的Prompt生成了问题答案。

LLM在哪些环节发挥了作用

输入图片说明

向量数据库的作用

输入图片说明
更准、更快:

  1. 语义理解与相似性匹配

向量数据库通过将文本转换为高维向量,捕捉了文本的语义信息。这意味着即使文档中不包含与查询完全相同的关键词,只要语义相似,也能被检索到。例如,如果用户问“最近的咖啡店在哪里?”,向量数据库可以检索到包含“附近的咖啡店推荐”或“周边咖啡店列表”等语义相似的文档。相对全文检索技术,增加了语义分析的能力。

  1. 高维向量的高效检索

向量数据库使用高效的索引结构(如HNSW、IVF等)来处理高维向量的相似性搜索。这些索引结构能够在大规模数据集中快速找到与查询向量最相似的向量,从而提高检索的准确性和效率。例如,HNSW通过构建多层概率图结构,能够在大规模高维数据上实现高效的近邻搜索。

RAG在如下场景存在问题

场景一:需要跨信息片段进行推理

问题:“爱因斯坦和牛顿的理论在哪些方面有相似之处,又在哪些方面有不同?”
数据来源:
文档1:详细介绍了牛顿的经典力学理论,包括运动定律和万有引力定律。
文档2:详细介绍了爱因斯坦的相对论,包括狭义相对论和广义相对论。
普通RAG的表现问题:
难以连接点:普通RAG可能只能分别提取关于牛顿和爱因斯坦理论的片段信息,但难以将这些信息片段进行有效整合,以回答两者之间的相似性和差异。例如,它可能无法准确地指出牛顿的万有引力定律和爱因斯坦的广义相对论在描述引力时的不同观点。
缺乏推理能力:普通RAG可能无法理解两种理论在哲学思想、数学方法等方面的相似之处,因为它难以通过共享属性(如对自然规律的数学描述)来遍历不同的信息片段,从而提供新的综合见解。

场景二:需要全面理解大型数据集的汇总语义概念

问题:“分析20世纪初物理学领域的重大突破及其对现代科技的影响。”
数据来源:
大型文档集合:包含20世纪初物理学领域的多篇重要论文、科学杂志文章和历史文献,涵盖了相对论、量子力学、原子物理等多个领域。
普通RAG的表现问题:
无法把握整体语义:普通RAG可能在处理如此庞大的数据集时,难以全面理解其中的汇总语义概念。例如,它可能无法准确地总结20世纪初物理学领域的核心突破点,如相对论和量子力学的提出及其意义。
缺乏综合分析能力:普通RAG可能无法将这些重大突破与现代科技的具体应用(如半导体技术、核能利用等)进行有效关联,从而无法提供一个全面的分析框架来回答问题。它可能只能提供一些碎片化的信息,而无法形成一个有逻辑、有深度的综合回答。

场景三:需要深入理解单个大型文档的复杂概念

问题:“解释《战争与和平》中托尔斯泰对人性的刻画及其在不同人物身上的体现。”
数据来源:
单个大型文档:《战争与和平》的完整文本,包含丰富的人物、情节和主题。
普通RAG的表现问题:
难以理解复杂概念:普通RAG可能在处理如此长的文本时,难以深入理解托尔斯泰对人性的复杂刻画。例如,它可能无法准确地分析出不同人物(如皮埃尔、安德烈等)的性格发展及其背后的人性主题。
缺乏深度分析能力:普通RAG可能只能提取一些表面的人物描述,而无法深入挖掘托尔斯泰在不同人物身上体现的人性复杂性和多样性。它可能无法将这些人物的行为、心理变化与人性的主题进行有效整合,从而无法提供一个有深度的文学分析。

场景四:需要综合多个领域的知识

问题:“探讨人工智能在医疗和金融领域的应用及其面临的伦理问题。”
数据来源:
多领域文档集合:包含人工智能在医疗领域的应用案例、技术论文,以及在金融领域的风险评估、监管政策等文档。
普通RAG的表现问题:
难以跨领域整合信息:普通RAG可能在处理涉及多个领域的知识时,难以将医疗和金融领域的人工智能应用进行有效整合。例如,它可能无法准确地分析出人工智能在两个领域中的共同应用点(如数据隐私保护)和不同应用点(如医疗影像诊断与金融风险预测)。
缺乏伦理分析能力:普通RAG可能无法将技术应用与伦理问题进行有效关联,从而无法全面回答问题。它可能只能提供一些碎片化的技术应用信息,而无法深入探讨伦理问题,如人工智能在医疗领域的误诊风险或在金融领域的算法歧视问题。
这些例子表明,普通RAG在处理需要跨信息片段进行推理、全面理解大型数据集或单个大型文档的汇总语义概念以及综合多个领域的知识时,可能会表现出明显的局限性。

graphRAG:下一代的rag技术

graphRAG处理流程

rag的流程
输入图片说明
graphRAG的流程,是很相似的,只是将向量数据库改成了图存储。在识别图中节点和节点之间的关系时,使用了LLM技术。
输入图片说明
可以说,LLM的发展有效降低了知识图谱的构建难度,而知识图谱作为一种有效的知识组织形式辅助LLM更好地利用相关知识、背景知识、关联知识生成更准确、更有用的答案,两者相辅相成打造更智能的AI产品。

graphRAG的优势

跨信息片段进行推理
全面理解大型数据集的汇总语义概念
深入理解单个大型文档的复杂概念

--B站/抖音:写代码的产品飞哥

--分享运营真实案例,用编程创造自己的产品

0 条评论