下一代知识管理技术维度的趋势

下一代知识管理技术维度的趋势

编译/刘枫宁

若仅从全新突破性技术的角度来审视下一代知识管理(KM),不仅是一种严重的简化 —— 更是对该领域的极大误解。自主智能体、语言模型、向量数据库、知识图谱等技术固然为知识管理的核心能力提供了支撑,但这并非全貌。

相反,下一代知识管理的核心特征将体现在智能文档分类与处理、通用问答、低代码应用构建、系统集成及实时反馈机制上。技术整合的关键在于,让组织能够与自身知识资产高效互动,同时不忽视知识管理的基本原则 —— 即技术的核心价值在于人的使用,这正是下一代知识管理的本质所在。

“这些架构直击知识管理的核心要义 —— 全球知识工作者都只是‘希望在恰当的时刻获得合适的资产,以完成工作’,”iManage 全球产品负责人(知识、搜索与 AI 领域)亚历克斯・史密斯(Alex Smith)表示。这一朴素需求催生了下一代企业知识管理与检索架构,其核心优势往往体现在知识消费的即时性上。

知识图谱关系(Knowledge Graph Relationships)

知识图谱框架已成为帮助组织全面理解可用资源、实现业务目标的最实用工具之一。

史密斯进一步指出:“它不仅能为企业内容提供丰富的元数据描述,还能将内容相关的流程与人员置于具体情境中,实现‘内容与工作流、人员及其使用方式的关联’。” 语义知识图谱在这方面尤为重要 —— 它整合了包括各类数据库在内的整个系统,帮助组织全面理解各要素之间的关联及与特定目标的契合度。

那些善于利用知识图谱进行人力资源回溯或项目复盘的组织,正通过关联产品、IT 系统与人员,实现极高精准度的跨维度查询。

Franz 公司首席执行官扬斯・阿斯曼(Jans Aasman)举例道:“你可以找到在生成式 AI(GenAI)智能体领域最具专长、且成功参与过此类项目系统设计的人员,进而判断他们的薪资是否符合市场水平 —— 这个查询至少涉及四个数据库。”

图谱增强生成(GraphRAG)

知识图谱在图谱检索增强生成(GraphRAG)范式中或将发挥更大价值。

检索增强生成(RAG)是提示词增强的重要形式之一,能为语言模型在自然语言问答、语义搜索和向量相似度搜索中提供更丰富的上下文。

史密斯提到,许多人认为 GraphRAG 是对传统 RAG 的优化,因为 “它具备让 AI 锚定答案关联性的基础能力 —— 即‘这是答案,且与以下内容相关’”。与非图谱类 RAG 不同,GraphRAG 可利用图谱的全部内容进行元数据过滤,从而实现这一核心目标。

这种方法不仅能提升搜索结果的准确性,还能减少模型检索的内容量,带来成本优势。

阿斯曼解释道:“GraphRAG 的核心逻辑是为每份文档标注关键术语;当用户提出问题时,系统会先找到所有相关术语,再通过结构化查询筛选适用文档,最后执行 RAG 流程。”

相关链接

企业AI知识库搭建与运营培训课程
呼叫中心AI知识库培训课程
个人知识体系构建能力课程

知识管理、知识管理专家田志刚介绍

知识库知识管理系统

企业AI知识管理知识库软件系统清单
个人知识管理软件AI知识库系统清单

自然语言问答(Natural Language Question-Answering)

在许多场景中,企业搜索的核心 —— 信息检索,正逐渐演变为自然语言问答。

Pega 客户服务产品高级总监马特・莱克(Matt Lake)表示:“通过 RAG 方法(语言模型检索多模态向量嵌入),组织可以整合分散的知识源,‘构建完整、连贯、集中的知识管理系统,并将其应用于新场景,例如通用问答,或嵌入 Slack、Teams 等平台的知识问答系统’。”

与问答相关的 RAG 核心维度包括:

  • 反馈机制(Feedback Mechanisms):RAG 的新兴应用之一是优化向量库中企业知识的数据筛选、元数据描述乃至内容本身。莱克指出:“我们发现,基于 RAG 的系统是暴露底层知识管理系统问题的有效工具。当用户得到错误、无意义或不完整的答案时,第一反应往往是‘AI 不够智能’,但实际上,问题通常出在底层文档的不准确或不完整上。” 通过实时向组织反馈此类信息,RAG 系统能推动文档修正,进而优化知识库。
  • 自动化机遇(Automation Opportunities):通过审计 RAG 系统、用户查询内容及模型响应质量,组织可以识别自动化潜力领域,进一步普及企业知识的可及性。莱克补充道:“如果客服人员使用问答功能获取答案,我们可以追踪该答案的使用频率及成功率 —— 这一反馈机制能帮助判断哪些问题未来可通过聊天机器人自动应答。”
  • 上下文工程(Context Engineering):尽管 RAG 常与生成式 AI 部署关联,但它只是提示词增强的形式之一,需要通过提示词工程获取最佳效果。而 “上下文工程” 正迅速取代提示词工程,其核心是扩展传递给语言模型的上下文范围。这一概念的兴起部分源于传统 RAG 的局限性。阿斯曼质疑:“若将所有法律文档存入向量库,用户虽能提问,但系统如何确保选中正确的合同?面对 1000 份合同,它的判断依据是什么?”
  • 局限性(Shortfalls):提示词或用户问题中的信息有限性,也降低了人们对 RAG 的近期预期。Laserfiche 首席执行官迈克尔・艾伦(Michael Allen)表示:“RAG 的缺点在于,它仅从语料库中提取片段放入提示词,可能遗漏大型语言模型(LLM)用于提升输出质量的重要信息。”

扩展上下文(Increasing Context)

近期一项有望弥补 RAG 部分缺陷的进展是:无论是大型前沿模型还是小型语言模型,均扩大了提示词输入窗口。

艾伦举例道,当用户询问产品手册或客服手册中的信息时,“无需通过 RAG 提取片段,可直接将完整手册输入模型”。这一突破的影响广泛且深远,尤其体现在 RAG 的应用场景中:

“在某些情况下,将所有信息纳入模型查询,甚至可以完全省去 RAG 步骤;对于部分应用,也无需再依赖复杂的 RAG 算法。”

此外,这一进展还大幅降低了 “文本分块” 的难度 —— 即无需再纠结于创建向量嵌入的合理尺寸与离散程度。

智能分类(Intelligent Classification)

组织还可通过实施不同的分类方法扩展内容上下文。

这些标签与分类可辅以丰富的元数据描述,这对提升知识图谱、人类、语言模型及 AI 智能体的关联识别能力至关重要。史密斯表示:“在文档分类领域,我们经历了从‘明确描述的机器学习’到‘机器学习 + 提示词 + LLM’的重大转变 —— 在内容筛选或管理流程中,系统能主动建议更多上下文信息。”

在某些场景中,对语言模型响应使用情况的审计与分析结果,可重新存入向量库,以标识其在特定用例中的适用性。莱克指出,这种方法能 “增加文档的归因信息,丰富上下文,并确保返回答案时充分利用这些信息”。

为文档分类添加元数据的另一种方法是:通过关键词搜索文档,并根据搜索结果建立索引。若将这些关键词与更广泛的分类法关联,这一基础方法的价值将进一步提升。

阿斯曼解释:“仅依赖关键词会遗漏所有同义词;而通过将关键词与分类法链接,组织可在基于关键词的文档分类中纳入同义词。”

他还提出了另一种方案:为分类法及其关联术语生成向量嵌入,再将文档发送至语言模型,由模型用这些嵌入标注文档。

智能文档处理(Intelligent Document Processing)

为企业内容创建元数据描述与标签的最前沿方法,是史密斯提到的 “建议式” 方案 —— 主要通过先进机器学习实现。

在整合图像及基于视觉语言模型(VLM)的智能文档处理应用时,这项技术变得尤为重要。艾伦表示,视觉语言模型(VLM)“能实现图像的文本理解:例如输入文档图像或 PDF,模型可描述其中内容”。这类模型还擅长图像分割,能识别文档的不同部分(如图表),并读取其中信息、提取所需内容,再转换为表格等形式。

艾伦补充道:“若将 VLM 与 LLM 结合,可构建文档数据库处理流水线,其准确性远超以往水平。” 这些模型有望将分割与视觉搜索应用于视频领域,并最终取代光学字符识别(OCR)等传统采集技术。目前,它们已能支持特定应用:“无需通过 OCR 即可提取文本片段,再将识别出的纯文本部分送入 OCR 引擎 —— 相比通用 VLM,这种方式效率更高、成本更低。”

低代码应用构建(Low-Code Application Building)

几乎所有依赖先进机器学习模型的重要用例,都隐含着整合各来源知识的需求。阿斯曼强调:“如果生成式 AI 能与所有数据库交互,它将为知识管理提供巨大助力 —— 但前提是,生成式 AI 需了解每个数据库的架构,以及如何转换数据以实现跨库整合。” 当组织采用能实现这些目标的方案时,其知识应用将更具实际意义。

莱克描述了一个典型流程:用户为特定业务功能整合来自视频、图像、技术文档、最佳实践、邮件等来源的结构化与非结构化数据,系统会 “将海量文档转化为标准化流程:定义分阶段处理步骤,并基于摄入的所有信息构建数据模型”。甚至有系统能根据这些信息、数据模型及流程步骤,近实时生成应用(如保险理赔处理系统)。

当前发展轨迹(The Present Trajectory)

不可否认,下一代知识管理将广泛应用生成式模型,但这一切都将在知识管理领域的核心目标框架内进行。

更重要的是,生成式模型需与知识图谱、向量数据库、文档管理系统、数据湖等其他基础设施合理协同。尽管这套基础设施与技术的组合尚未能完全自动化任一核心业务功能,但它已为日益广泛的应用场景提供了坚实的起点。

史密斯将下一代知识管理比作 “教练”:“最终我们将拥有类似教练的系统 —— 你提出问题,得到的是指导性建议。

我刻意避免使用‘答案’这个词,更愿意称之为‘起点’。作为知识工作者,我与系统交互时,它会给出这样的建议:‘我认为你可以这样做’,或‘组织内其他人是这样处理的’。”

无论知识管理者与知识管理技术是否会演变为 “教练”,知识管理的本质始终不在于工具与技术本身,而在于如何通过这些工具的使用,满足组织在知识存储与获取方面的核心需求。

原文作者:杰拉尼・哈珀(Jelani Harper)IT 市场编辑顾问 来源:KMWorld

发表回复

*您的电子邮件地址不会被公开。必填项已标记为 。

*
*