RAG的技术发展

发布时间:2026/6/27 6:43:35
RAG的技术发展 RAG 技术已从早期的‌朴素检索Naive RAG‌演进为具备‌结构化推理‌与‌智能体自主决策‌的复杂系统。当前主流技术范式及演进逻辑如下Naive RAG原生/基础 RAG‌‌定义‌最基础形态流程为“文档切块→向量化→向量检索→拼接生成”。‌局限‌仅依赖语义相似度难以处理多跳推理、全局宏观理解及实体间复杂关系易产生幻觉 。‌地位‌当前工业界简单问答场景的基线标准但正逐渐被高级范式补充或替代 。‌‌GraphRAG图谱增强 RAG‌‌核心‌引入‌知识图谱‌将非结构化文本转化为“实体 - 关系”图结构支持‌社区聚类‌与‌分层摘要‌。‌优势‌解决 Naive RAG“连点成线”难题擅长‌全局理解‌如总结整个知识库趋势和‌多跳推理‌ 。‌代价‌构建成本高需大量 LLM 抽取实体增量更新困难适合静态或低频更新的大规模知识库 。‌代表‌Microsoft GraphRAG2024 年主推通过 Leiden 算法聚类实现 Global Search 与 Local Search 。‌‌‌SAG (SQL-Retrieval Augmented Generation)‌‌核心‌2026 年新晋 SOTA 范式用‌关系型数据库SQL‌重构数据底座。将文本解析为“事项Event 实体Entity”利用‌超边结构‌连接多对多关系。SAGSQL 检索增强生成‌全称 SQL-Retrieval Augmented Generation通过 SQL 驱动检索部分重构 Agent 数据底座。‌核心架构‌离线阶段将原始文本整理成事项 实体的数据库结构查询时用 SQL 动态串联局部线索网 。‌超边结构‌一个事件event可连接多个实体entity形成多对多关联比三元组更轻便且保留完整语义 。‌混合检索‌结合 SQL 精准检索和向量语义匹配能力既支持实体精确匹配也支持语义模糊搜索‌优势‌‌动态扩展‌无需预建全局图查询时通过 SQL Join 临时组装局部线索网支持‌秒级延迟‌处理亿级数据 。 ‌多跳推理强‌在HotpotQA 等多跳测试中召回率显著优于 HippoRAG 2更适合 Agent 长期记忆与状态追踪 。‌易维护‌支持增量写入避免 GraphRAG 的全量重建痛点 。‌定位‌平衡了结构化推理与工程落地成本是 Agent 时代的高性价比数据底座 。‌‌Agentic RAG智能体 RAG‌‌核心‌赋予模型‌自主决策权‌模型可判断“是否检索”、“何时检索”及“如何迭代优化”。‌特点‌融合工具调用、多轮反思与自我纠错不再是线性流水线而是动态规划系统 。‌趋势‌常与 GraphRAG 或 SAG 结合作为上层调度器使用 。‌‌LLM Wiki‌LLM Wiki‌通常指基于维基结构的‌结构化知识库‌范式。不同于 Naive RAG 的扁平切片它强调‌手动或半自动的 WikiLink‌关联具备持续积累能力但缺乏自动化的深度关联推断常作为 GraphRAG 的数据源或轻量级替代方案 。‌技术融合趋势‌单一范式难以通吃未来主流是‌混合架构‌。例如底层用 SAG/GraphRAG 存储结构化知识上层用 Agentic RAG 进行路由与决策同时支持多模态输入 。‌‌谷歌在本月发布的okf标准选型建议‌简单问答/低成本‌Naive RAG 重排Rerank。‌全局总结/复杂关系推理‌GraphRAG接受高构建成本。‌大规模动态数据/Agent 记忆/多跳查询‌‌SAG‌当前工程落地优选。‌复杂任务规划‌Agentic RAG需搭配上述任一检索后端。