田志刚:企业Agent的门槛已经不是大模型,而是AI知识库的质量:关键是这五个核心问题
备注:本文为田志刚老师的讲座部分内容文字版,更详细内容可以听AI知识库搭建与运营培训在线课程,该课程提供了相应的模板、方法论,并由田老师提供一对一指导。可联系微信号:511956894 或者电话:010-62925738
刚开始的时候,人们认为什么呀?
就是说企业 Agent 落地的核心在于大模型的能力。所以有段时间大家总是在探索,就是用什么样的大模型更好,然后认为只有大模型能力强的结果就好。
但是事实上真正做起来以后,最近这半年,大家慢慢形成一个共识:阻碍 AI 落地的门槛已经不是大模型了。
我们有一些客户,比如那些大型的企业,在他们内部已经接入了国内外各种大模型(包括国内国外的主流模型),都可以方便的选用。
但是在这种最强大的模型支撑下,真正去落地的时候,都发现结果仍然不令人满意。大家慢慢明白,企业AI Agent落地的背后,核心其实是企业的私有数据问题。站在IT立场上,叫数据。站在管理立场上,叫知识管理或者知识库的问题。
我们把这里面的核心问题分成五个维度:
- 知识内容过时、版本冲突、文档异构性强;
- 缺少统一语义层,跨系统概念无法消歧,造成输出结果混乱;
- Chunking / Parsing规则简单粗暴,破坏上下文与约束条件;
- 检索输入噪声大,重复内容和无关内容挤占上下文;
- 缺少动态记忆与执行回写,任务状态无法闭环。
因为这些内容的来源可能来自于各种系统里,比如原来的文档系统、原来的CRM、原来的ERP、原来的各种研发系统。各种不同的来源,可能原来在单个来源上有一些规则,但是整个串起来的规则是没有的。
还有一个就是语义层是欠缺的,术语的统一没有。然后,跨系统概念是乱套的。同名异义什么意思呢?就是说都叫“客户”这个词、这个概念,但是事实上在ERP里、在研发系统里、在文档系统里,它的意思是不一样的。在这种情况下,任何大模型的输出质量一定是混乱的,输出一定是混乱的。

还有就是说,假如说这个分块。比如说很多人是刚开始粗暴的时候,我1000个字和800个字分一块。但是这样一定是把这个核心的语义、关键的意义给丢掉了。那就是说,应该怎么去按语义的方式去分?这些就涉及到一个文档内容的结构化。这个程度也不够。
没有之前,大部分我们做知识管理、知识库都是20多年,大部分是欠缺好的结构化,没有定义出来。其实我们的对策,就是假设常用的内容应该建立起一个内容产出的模板来定义好。什么样的内容有一个什么样的结构,这个是固定的。那这样效果就会更好。
但这里面最难的一个地方——这5个点我不展开了,大家可以看一下——最难的地方是什么?
我们在《2026年中国知识库趋势》里写过,最难的一个地方是大家认识到这个问题了,认识到知识库是个核心,也认识到知识库里面有很多细碎的问题。但是大家大脑里没有这个标准——好的知识库到底应该是什么样子的?没有,只有一些零散的点。
这种情况下,真正大家在做这个活的时候,就可能想到哪个点做一下,想到哪个点做一下,但是“按下葫芦又起了瓢”。
没有系统思考的话,总是出问题的。我们的建议是,你在做这个知识库的时候,先要建立好的知识库的标准,应该包括哪几个维度。
假如说,你要有这个术语表,要有分类的规则,要有元数据规范,要有更新的机制,要对到人、谁负责。然后对知识分层,哪些是核心的,哪些是关键的,哪些是次重要的,哪些是不太重要的。
当然,在建立AI知识库的过程中,比如执行回写、动态信息的记录,这些也都要考虑到。
然后有了这个标准规范,有了这个好的标准,我们再去检视我们的知识库欠缺哪些内容。我们在 AI知识库 搭建运营的在线课程里有详细的讲解,你们有兴趣可以听一听。
但是,这个事儿是一个大的问题,它不是说短期内一下子能解决的。你首先要想,才能去做。当然,做的过程中可能也会有很多问题,也欢迎大家跟我们一起交流和探讨。
将来的话,大家预测大模型会像电力、水一样,成为一种普遍能力,任何人都可以用,任何机构都可以用。
那这个时候真正构成企业一个竞争优势的东西,一定是你的私有的知识库。这个知识库是内容准确的、更新及时的、语义统一的,并且里面有更多更有价值的私有知识持续产出、持续更新,这才是一个企业的核心竞争力。
而如果说这个大模型本身构不成竞争力,因为它自身能力是个公开的能力,任何人都可以用。所以说在这个基础上——也就是 知识库 的搭建与运营——下功夫,才是真正能提升企业竞争优势的地方。
相关链接
经典培训课程
企业AI知识库搭建与运营培训课程
呼叫中心AI知识库培训课程
个人知识体系构建能力课程
书籍和资料
《卓越密码如何成为专家》
《你的知识需要管理》
免费电子书《企业知识管理实施的正确姿势》
免费电子书《这样理解知识管理》