为什么Karpathy是对的:RAG已死, 智能体Wiki永生
过去两年,人工智能行业一直沉浸在一个普遍却自欺欺人的共识里:
检索增强生成(RAG)是企业 AI 的终极架构。
它作为必要的起步方案,是让大语言模型基于私有数据生成内容的巧妙方案,但这条路已然走到尽头。如今回头看,它的底层缺陷显而易见,甚至让人觉得有些讽刺。
摘要
Andrej Karpathy(前特斯拉AI负责人)提出的全新智能体架构,揭示了检索增强生成(RAG)的根本性缺陷:它是一种无状态、无记忆的处理流程,每次查询都要 “重新发现” 知识,造成算力与上下文信息的大量浪费。
未来属于持久化、有状态的知识层—— 即 “智能体维基(Agentic Wiki)”。大语言模型智能体将主动构建、维护并持续积累知识,知识只需一次性构建并不断优化,而非反复重新推导。
Karpathy基于本地笔记工具 Obsidian 实现的方案,对个人用户而言是极为出色的概念验证,但因在可扩展性、安全性与可审计性上存在关键短板,无法适用于企业场景。
Epsilla 语义图谱正是这一理念的企业级落地成果:一套服务端部署、支持事务处理且安全可控的知识层。我们的 AgentStudio 提供智能体部署管控平台,ClawTrace 则确保所有操作可审计。这正是构建企业大脑的核心架构。
正文
过去两年,人工智能行业一直沉浸在一个普遍却自欺欺人的共识里:检索增强生成(RAG)是企业人工智能的终极架构。它是必要的第一步,是让语言模型基于私有数据生成内容的巧妙临时方案,但这条路已然走到尽头。如今回头看,它的底层缺陷显而易见,甚至让人觉得有些难堪。
RAG 是无状态的。每一次查询都是全新的开始。无论模型是 GPT‑5 还是 Claude 4,它都只是一个才华横溢却毫无记忆的天才。它每次都要从头重读相同的源文档、重新推导相同的洞见、重新合成相同的答案。如果用户提出一个需要整合五份文档的问题,系统就会执行一次高成本、高冗余的合成;一分钟后用户再问一遍,它会再完整重复一遍。没有学习,没有知识积累,没有持久状态。
这正是安德烈・卡帕西近期在 GitHub Gist 上发布的、利用大语言模型智能体构建个人知识库的方案如此重要的原因。它不只是一个面向 Obsidian 用户的巧妙工作流,更是对整个 RAG 范式一针见血的批判,也是下一代架构的蓝图。他以工程师的精准,清晰阐述了我们在 Epsilla 一直打造的架构。无状态检索的时代已经结束,有状态、由智能体维护的知识时代正在开启。
拆解Karpathy理念:从检索走向编译
卡帕西的核心论点简洁而深刻:
与其让大语言模型从静态的原始文档池中做即时检索,不如部署一个大语言模型智能体,主动、持续地将这些文档编译成一个持久、互联、结构化的知识库 —— 一个维基系统。
这彻底颠覆了原有范式。阅读、理解、提取实体、识别关系、归纳结论这些高认知成本的工作,只在数据接入阶段执行一次。知识随后以结构化、可查询的形式存储。后续提问不再触发对原始 PDF 疯狂且昂贵的全文检索,而是对预先编译好的动态数据模型执行轻量查询。
他将其定义为三层架构:
1. 原始数据层
这是不可变的事实来源 —— 包含文章、会议纪要、论文、报告等在内的只读集合。智能体从中读取内容,但永远不会修改它。
2. 维基层
这是动态的、由智能体维护的知识图谱。它由一组 Markdown文件构成,代表实体、概念、摘要与分析。智能体对这些文件进行编写、更新和交叉关联,构建出丰富互联的知识网络。这是系统的长期记忆。
3. 模式层
这是智能体的指令集,通过配置文件(如 AGENTS.md)定义其目标、规则与工作流。它规定智能体应如何接入新数据、何为重要实体,以及如何维护维基的完整性。它将通用大语言模型转变为严谨的知识策展人。
在这套架构中,智能体执行三大核心操作:
- 接入(Ingest)当新文档加入原始数据层时,智能体阅读并提炼核心要点,对维基进行一系列更新。这不只是创建摘要页,更是更新十几个相关实体与概念页面、添加交叉链接,并标记与现有知识的矛盾之处。
- 查询(Query)当你提出问题时,智能体不会回到原始数据,而是先查阅维基的索引页找到相关内容,读取这些经过梳理的页面,再合成条理清晰的答案,并附上指向维基页面的引用。尤为关键的是,极具价值的回答本身可以被写回维基,成为新的永久知识资产。
- 整理(Lint)智能体定期执行维护,扮演知识园丁的角色。它查找矛盾内容、定位孤立页面、识别需要独立成页的概念,并建议进一步研究的方向。这确保知识库不会退化,而是持续自我优化。
卡帕西的比喻十分贴切:
Obsidian 是集成开发环境(IDE),大语言模型智能体是程序员,维基则是代码库。而你是架构师,主导整个项目。
这不再是简单的文档检索,而是可复利增长的知识资产。
企业级鸿沟:为何 Markdown 无法规模化落地
卡帕西的这套体系,作为个人场景的方案,设计优雅且效果出色。对于独立研究者、分析师或写作者而言,它堪称范式革新。
但对《财富》世界 500 强企业来说,这一方案完全不具备落地条件。企业大脑不可能建立在本地 Markdown 文件文件夹之上。一旦试图将该架构扩展至多用户、核心业务环境,整个模型就会在一系列企业级挑战面前彻底失效。
- 可扩展性与性能一个 index.md 索引文件加 grep 命令,处理几百份文档尚可应付,但无法承载全球化企业 PB 级别的结构化与非结构化数据。要维护一个包含数百万节点、覆盖所有客户、交易、产品与员工的 “维基”,纯文件系统根本无从实现可扩展的索引、查询或事务一致性。
- 安全与权限控制对一批 Markdown 文件,无法实现精细化的基于角色的访问控制(RBAC)。在企业中,财务智能体必须无权查看人力资源绩效评估,销售智能体也不能写入产品研发路线图。而本地优先的模式,完全没有权限、角色与数据治理的概念。
- 协作与并发当十几个智能体同时服务数百名用户,都在执行数据接入与维基更新操作时会发生什么?卡帕西的模型默认只有单个智能体与一名人工管理者,而企业场景会出现竞争条件、写入冲突,若知识层没有成熟的事务型数据库支撑,甚至可能引发灾难性的数据损坏。
- 可审计性与合规性简单的追加式 log.md 日志,并非不可篡改的审计追踪记录。在金融、医疗、政务等受监管行业,智能体的每一步操作都必须记录在安全、防篡改的系统中:谁访问了什么数据?某一结论基于何种推理?知识库节点为何被更新?纯文本文件完全无法满足合规、安全取证乃至高效调试的要求。
卡帕西为我们指明了正确的概念架构,但要将其打造为企业级方案,就必须从本地文件升级为稳健的服务端实现。
Epsilla 架构:企业级智能体维基
这正是我们设计 Epsilla 要解决的核心问题。我们早已看到无状态 RAG 的局限,也意识到未来需要由智能体管理的持久化、有状态知识层。我们的平台,就是卡帕西理念在企业级场景的完整落地。
从 Markdown 维基升级为语义图谱
企业版的 “维基层”,并非一堆文本文件,而是Epsilla 语义图谱。这是专为组织级长期记忆打造的定制化图数据库。
- 结构化与统一化语义图谱不只存储 Markdown,还能统一整合文档中的非结构化文本、API 半结构化数据,以及现有 SQL 与 NoSQL 数据库中的结构化数据。例如 “苹果公司” 节点,既可以包含新闻摘要,也能带有股票代码等结构化属性,并关联到 “蒂姆・库克”“iPhone 18” 等节点。
- 事务化与并发支持语义图谱是真正的数据库,支持符合 ACID 规范的事务,可让数百个智能体同时读写,而不会出现数据损坏或竞争冲突。
- 安全可控与治理权限由精细化 RBAC 体系管控。可定义策略:例如销售角色智能体可查看客户节点,但无权查看合同金额字段,除非其同时拥有销售管理层角色权限。
从 AGENTS.md 到 AgentStudio
在企业环境中,“模式层” 绝不能只是一个简单的提示词文件,而必须是一套支撑智能体工作流的高级管控平台—— 这就是 Epsilla 的 AgentStudio。
AgentStudio 实现了从 “写提示词” 到 “做开发” 的跨越。它是一套完整环境,可将大量智能体作为真正的智能体即服务(AaaS)平台进行定义、部署与管理。你可以指定智能体的用途,为其安全开放特定数据源(API、数据库、文档库),并通过模型上下文协议(MCP)为其配置工具。你可以定义智能体的 “数据接入” 与 “知识整理” 工作流 —— 不是文本文件里的建议,而是可定时、可版本控制、可全程监控的正式流程。
从 log.md 到 ClawTrace
最后,企业需要一套不可篡改、安全可信的记录系统。日志绝不能是可随意修改的文本文件。因此,我们整个平台深度集成了 ClawTrace—— 业内领先的 AI 可观测性与审计平台。
智能体的每一步操作 —— 从数据源读取、对语义图谱发起查询、执行更新,到调用 GPT‑5、Llama 4 等模型完成推理 —— 都会以加密、不可篡改的事件形式记录在 ClawTrace 中。这为企业大脑里的每一条知识构建了牢不可破的溯源链。它不仅用于调试,更服务于合规、安全,以及为自主系统建立真正可信的基础。
相关链接
经典培训课程
企业AI知识库搭建与运营培训课程
呼叫中心AI知识库培训课程
个人知识体系构建能力课程
书籍和资料
《卓越密码如何成为专家》
《你的知识需要管理》
免费电子书《企业知识管理实施的正确姿势》
免费电子书《这样理解知识管理》
知识库知识管理系统
企业AI知识管理知识库软件系统清单
个人知识管理软件AI知识库系统清单
未来属于 “编译式知识”
从 RAG 转向由智能体维护的知识图谱,并非渐进式优化,而是底层架构级变革。这就好比一台只能按输入解题的计算器,与一位能学习、记忆、并在每一条新定理上持续构建知识体系的数学家之间的差距。
无状态 RAG 是我们走到今天的必要过渡,它验证了让大语言模型基于私有数据运行的价值。但它的局限已十分明显。
未来不属于只会检索的系统,而属于能够理解的系统。而理解,离不开记忆。
安德烈・卡帕西优雅地勾勒出了个人记忆系统的蓝图,而我们正在为企业打造可信、可扩展、安全可靠的企业级记忆体系。一切才刚刚开始。
常见问题:智能体记忆与 RAG
1、这个 “智能体维基” 不就是带缓存的、更复杂的 RAG 吗?
不是。
RAG 是基于原始数据源的无状态、即时检索过程;而本架构是有状态、主动编译过程。智能机会先构建持久化的结构化知识模型,再对其查询。源文档仅在接入时读取一次,而非每次查询都重新读取。
2、这套架构如何处理实时或流式数据?
“数据接入” 是持续过程,而非一次性批处理任务。Epsilla AgentStudio 中的智能体可配置为监听实时数据流(如 Slack、新闻源、物联网数据),并近乎实时地更新语义图谱,确保企业大脑始终保持最新状态。
3、向量搜索在新模式中扮演什么角色?
向量搜索依然是关键工具,但角色发生了转变。
智能体不再用它检索原始文档分块,而是将其作为高性能索引,在庞大的语义图谱中快速定位需要读取或更新的相关节点与子图。它成为了智能体的注意力机制。