MemoRAG：引领 RAG 新纪元的双阶段框架

在人工智能迅速发展的今天，信息的获取与处理变得愈加复杂。尤其是在面对模糊的信息需求或非结构化知识时，现有的检索增强生成（RAG）方法往往显得力不从心。为了解决这一问题，Sachin Kumar 在其最新论文中提出了一种名为 MemoRAG 的创新框架。该框架结合了长时记忆的优势，通过双系统架构实现了高效的信息检索和生成。

🧠 记忆与生成的完美结合

MemoRAG 的核心在于其记忆模块的设计。该模块通过将输入序列转化为紧凑的记忆表示，形成一个全球数据库的记忆。这一过程不仅提升了信息的存储效率，还为后续的生成任务提供了强有力的支持。具体而言，MemoRAG 通过一个轻量级但具有长距离处理能力的语言模型（LLM）来构建全球记忆，从而为生成初步答案提供线索，帮助检索工具在数据库中找到有用的信息。

如同在浩瀚的知识海洋中，MemoRAG 就是那艘高效的航船，利用记忆的力量引导我们找到最有价值的宝藏。

Y = Θ_{g e n} (\hat{X}, q ∣ θ)

在这个等式中， $Y$ 代表最终生成的答案，而 $\hat{X}$ 则包含输入查询或任务指令 $q$ 及检索到的上下文 $\hat{C}$ 。MemoRAG 利用这一公式，整合了输入和检索的上下文信息，确保生成的答案既准确又相关。

🔍 评估与实验：ULTRADOMAIN 基准

为了验证 MemoRAG 的有效性，研究团队开发了一套名为 ULTRADOMAIN 的综合基准，涵盖法律、金融、教育、医疗和编程等领域的复杂 RAG 任务。通过对比 MemoRAG 与传统 RAG 系统的表现，研究发现，MemoRAG 在生成高质量答案方面表现优越。

这一实验如同为 MemoRAG 的能力打下了坚实的基础，展示了其在多种复杂任务中的强大性能。通过将长输入上下文转化为易于处理的记忆表示，MemoRAG 不仅提升了生成的准确性，还增强了系统的整体效率。

⚙️ 系统实现与灵活性

在实施层面，MemoRAG 提供了两种记忆模型：memorag-qwen2–7b-inst 和 memoragmistral-7b-inst，它们基于 Qwen2–7B-Instruct 和 Mistral-7B-Instruct-v0.2。通过这些模型，MemoRAG 能够灵活应对不同的上下文长度，支持从 2 到 16 的压缩比，以适应各种环境下的需求。

此外，MemoRAG 也支持多种检索方法，包括稀疏检索、密集检索和重新排序，使得其在不同应用场景中都能游刃有余。

🔑 应用场景与未来展望

MemoRAG 的灵活性使其能够应对多种应用场景。例如，在处理模糊信息需求时，MemoRAG 能够通过其全球记忆推断用户的潜在意图；在需要分布式证据查询的情况下，该框架能够高效整合多个步骤的信息。无论是个性化助手任务还是长久的对话搜索，MemoRAG 都能提供精准的支持。

随着研究的深入，MemoRAG 有望在更多复杂的任务中展现其优势，推动 RAG 系统的进一步发展。

🌟 结论

MemoRAG 不仅是一种新型的 RAG 系统，更是信息检索与生成领域的一次重要突破。通过构建全球记忆并生成任务相关的线索，MemoRAG 显著提升了在复杂任务中的表现，展现了其广泛的适用性和强大的性能。

参考文献

Kumar, S. (2024). MemoRAG: dual-stage RAG framework using Memory LLM Model to generate answer clues for relevant Passages retrieval. Medium.
53AI. (2024). RAG+AI 工作流 +Agent：LLM 框架该如何选择，全面对比 MaxKB、Dify、FastGPT、RagFlow 等. 53AI.
Qian et al. (2024). MemoRAG: Moving towards Next-Gen RAG Via Memory-Inspired Knowledge Discovery. arXiv.
Hugging Face. (2024). Dataset of College Textbooks.

如同一座灯塔，MemoRAG 在信息的海洋中为我们指引方向，助力更智能的未来。

自己写了一个用思源进行 RAG 的服务端

请允许我自我宣传一波，同时也是希望有同样需求的朋友能够一起开发这个项目，特别是能够开发思源插件的朋友，因为我完全不会 TypeScript，也几乎没怎么用过 Vue.js。项目地址：[链接] 更详细的文档请参见项目仓库。开发动机虽然思源有自己的 AI 功能，也有一些 AI 插件，但是没有一个完全符合我的希望的： ..

AI 搜索你的所有笔记！思源笔记 +Cursor+MCP Server——打造你的个人专属 AI 资料库！（AI 大模型搜索笔记、内容总结、大纲凝练、RAG 搜索）

前排提示：本文撰写于 2025 年 2 月，仅仅离 Anthropic 发布的 MCP 协议过去不到 3 个月，因此本文很多接入 MCP 的方式还略显复杂。笔者相信，未来 MCP 协议一定会发展的越来越壮大和方便，届时使用和配置 MCP 也会越来越简单。总览 AI & 大模型最近的发展那可是一飞冲天，不知道大 ..

Graph Retrieval-Augmented Generation: A Survey

思考：RAG 为什么要引入 graph 克服了什么召回的内容是无法做到跨文档的召回的，或者说多跳推理 or 关联召回。更细粒度的相关性 [图片] 基于 KG 实现信息的处理补全和校验利用 KG 作为一路召回源利用 KG 来组织文档 chunk，来提升召回【有基于层次索引的，也有通过实体聚合的】 2024.9 月 ..

RAG3 课

关键词索引 es 数据库：是后台运行的数据库，不管 python 是否运行都会运行但是实际 RAG 开源项目中使用 es 数据库的不多，企业中 60% 都不用顾虑 1：es 本身部署是需要 8g 或以上内存的机器，10 亿条以内的文档检索都可以顾虑 2：es 高版本（8.x)支撑全文检索（倒排，bm25）+ 向量 ..

思源笔记自定义属性名无效

我发现自定义属性名比如 5，显示设定失败，必须设置成“custom-5”才行。可是帮助文档不是说会自动添加吗自定义属性由用户通过块标菜单 - 属性进行设置，属性名仅允许使用英文字母和阿拉伯数字（例如 doing、7days）。设置后，思源会自动在属性名前加上前缀 custom-，以区分内置属性和自定义属性。 #思源 ..

希望思源手机端优化动作界面

我主要使用电脑端进行笔记创作，而手机端则主要用于查看和复习笔记。由于我的笔记通常是大纲型的，因此在手机端查看时，我需要频繁切换文档树和大纲视图。然而，目前的切换操作无法单手完成，这给使用带来了不便。希望可以优化这一功能，例如通过向右滑动显示文档树，向左滑动显示大纲，从而提升手机端的使用体验。

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于