分类（Category/Classification）、元数据（Metadata）、标签（Tag）、实体（Entity）的属性之间的关系及案例

小K
2025年11月26日2025年11月26日
经典论述

分类（Category/Classification）、元数据（Metadata）、标签（Tag）、实体（Entity）的属性之间的关系及案例

编译/刘枫宁

下面我们来系统地对比 分类（Category/Classification）、元数据（Metadata）、标签（Tag）、实体（Entity）的属性 这四个概念在数据管理、信息组织、知识图谱、内容管理等场景中的含义、作用、联系与差异，并配上实际例子，便于理解。

维度	分类 (Classification / Category)	元数据 (Metadata)	标签 (Tag)	实体的属性 (Entity Attributes / Properties)
定义	把对象按照某种预定义的层级体系或规则划分到互斥/非互斥的类目中	“关于数据的数据”，描述数据本身特征的信息	自由、用户或系统添加的关键词，用来标记和检索内容	实体（人、物、概念等）在知识图谱或数据库中具体的特征字段
结构化程度	高（通常是树状或多层级体系）	中到高（结构化、半结构化、无结构）	低（扁平、无层级）	高（键值对，严格 schema）
是否互斥	通常互斥（单分类）或支持多分类	不适用	非互斥（可以打很多标签）	不适用
主要用途	导航、统计、分面浏览	描述、发现、管理、展示	民间分类、个性化检索、社交发现	描述实体本身，形成事实
创建者	通常由系统/管理员预定义	系统自动生成 + 人工补充	用户或社区自由添加	知识库构建者/爬虫/人工录入
可扩展性	扩展需要修改分类法，成本高	可随时增加字段	极易扩展，随意新增	扩展需要修改 schema，成本中等

举一个具体的例子：一篇博客文章《2024年北京冬残奥会冠军张怡宁的励志故事》

项目	具体内容	属于哪一类概念	说明
分类（Category）	体育 > 残奥会 > 冬季残奥会人物 > 运动员	分类	网站导航栏里点的目录，通常是树状结构，一个文章可能属于多个分类但有主分类
元数据（Metadata）	标题、作者：老王、发布时间：2024-03-15 字数：3200、阅读时长：8分钟格式：Markdown	元数据	描述这篇文章本身属性的数据，搜索引擎、CMS 后台主要靠这些字段管理内容
标签（Tag）	#残奥会 #张怡宁 #励志 #残疾人体育 #北京冬残奥会 #轮椅冰壶	标签	用户或编辑随意打的关键词，便于搜索和“相关文章”推荐，可多到几十个
实体的属性（知识图谱）	实体：张怡宁属性： – 性别：女 – 出生日期：1985-10-05 – 国籍：中国 – 运动项目：轮椅冰壶 – 获得奖项：2022北京冬残奥会冠军	实体的属性	在知识图谱中，张怡宁是一个独立实体，这些是它的结构化事实属性，可用于推理

更直观的对比图（同一篇文章）

text

文章实体
├── 分类（层级目录）
│   ├── 体育 → 残奥会 → 冬季残奥会
│   └── 人物 → 运动员
├── 元数据（描述文章本身）
│   ├── title = "2024年北京冬残奥会冠军张怡宁的励志故事"
│   ├── author = "老王"
│   ├── publish_date = 2024-03-15
│   └── word_count = 3200
├── 标签（自由关键词）
│   ├── 残奥会、励志、张怡宁、轮椅冰壶、北京2022…
└── 关联的知识图谱实体属性（文章里提到的“张怡宁”）
    ├── type = Person
    ├── gender = 女
    ├── birthDate = 1985-10-05
    └── award = "2022北京冬残奥会轮椅冰壶冠军"

总结一句话区别

分类：像图书馆的书架号，固定位置，帮助你快速找到大类。
元数据：像书的版权页，告诉你这本书是谁写的、什么时候出版的、有多少页。
标签：像读者自己在书上贴的便利贴，想贴多少贴什么都行。
实体的属性：像百科全书里对“张怡宁”这个人的正式条目，结构化的事实描述。

这四个机制经常一起使用，互相补充，共同构成了现代内容管理系统、知识图谱、搜索引擎的核心组织方式。

相关链接

企业AI知识库搭建与运营培训课程
 呼叫中心AI知识库培训课程
 个人知识体系构建能力课程

知识管理、知识管理专家田志刚介绍

知识库知识管理系统

企业AI知识管理知识库软件系统清单
 个人知识管理软件AI知识库系统清单

这些概念之间的相似性

它们之间确实存在 大量相似、重叠甚至互相替代 的场景，在实际系统中经常混用或部分功能重合。下面列出最常见的“长得很像”的地方，以及它们在什么情况下可以互相替代、什么情况下又不能。

相似点场景	具体表现	哪个概念在扮演另一个的角色？	可否完全互相替代？
标签 → 分类（民间分类 Folksonomy）	用户疯狂打标签，系统统计高频标签，自动生成“热门分类”：标签：#Python、#机器学习、#深度学习 → 变成导航栏“Python 教程”分类	标签在代替分类	可以部分替代（扁平分类）不能替代层级分类
分类 → 标签	管理员把分类名称直接当作标签自动打上：文章属于“科技 > 人工智能” → 自动添加标签 #人工智能	分类在代替标签	可以（很多 CMS 就是这么干的）
元数据 → 标签	元数据字段被拿来当标签用：元数据有“主题 = 气候变化” → 自动生成标签 #气候变化	元数据在代替标签	非常常见，几乎所有博客系统都这么做
标签 → 元数据	高频标签被固化成正式元数据字段：大家都在打 #4K #8K → 后台新增一个元数据字段“分辨率”	标签升级成了元数据	可以（标签→元数据的演进路径）
实体的属性 → 标签	知识图谱里的属性被拿来当标签：实体“周杰伦”有属性“职业=歌手” → 文章提到周杰伦时自动打标签 #歌手	实体属性在代替标签	非常普遍（百度、Google 知识图谱都这么干）
标签 → 实体的属性	社区疯狂打同一个标签，系统认为这是一个新实体属性：大家都在给电影打 #豆瓣9.0+ → 知识库新增属性“高分电影”	标签升级成了实体属性	可以（众包构建知识图谱的常见方式）
分类 → 实体的属性	分类体系直接映射成实体类型：属于“人物 > 运动员” → 知识图谱中该实体 type = 运动员	分类在定义实体类型（schema）	可以（很多知识图谱的类体系就是从分类来的）
元数据 → 实体的属性	文章的元数据被抽成实体属性：文章作者=老王，发布日期=2024-03-15 → 实体“这篇文章”有属性 creator=老王，datePublished=2024-03-15	元数据直接变成RDF/知识图谱的属性	完全可以（Schema.org 就是这么做的）

真实系统中常见的“混着用”例子

系统	实际是怎么混用的
WordPress	分类（Category） + 标签（Tag）分类是层级、互斥的，标签是自由的，但很多人只用标签不用分类
知乎	话题（本质是分类） + 标签（用户可加任意标签）但话题广场其实是把高频标签升级成了“话题”
微博	几乎完全用 #话题# 代替了传统分类（标签完全取代了分类）
百度百科/维基百科	页面属于“分类”（Category），同时有信息框（Infobox = 实体的属性），信息框字段也会自动生成标签和搜索推荐
Notion	数据库的“属性”（Properties）既是元数据，也是实体属性，用户还能加“标签”类型的多选属性，彻底混在一起了
bilibili	视频有分区（分类） + 标签（用户打） + UP主填写“视频类型/地区/年代”等元数据，三者一起决定推荐

一句话总结“相似性”

功能上高度重叠：都可以用来检索、推荐、聚合内容。
区别主要在结构化程度、治理方式和演进路径：
- 标签最自由 → 最容易长得像分类/元数据/属性（民间力量）
- 分类最严格 → 最难被其他东西完全替代（需要人工设计层级）
- 元数据和实体属性最像双胞胎（都是结构化键值对，只是一个描述文档本身，一个描述文档里提到的实体）

所以在小型系统里，很多人就只用“标签”一招鲜吃遍天；在大厂的知识图谱、推荐系统里，四者却是分工协作、层层递进、互相转化的关系。

知识管理中心KMCenter

分类（Category/Classification）、元数据（Metadata）、标签（Tag）、实体（Entity）的属性之间的关系及案例

分类（Category/Classification）、元数据（Metadata）、标签（Tag）、实体（Entity）的属性之间的关系及案例

举一个具体的例子：一篇博客文章《2024年北京冬残奥会冠军张怡宁的励志故事》

更直观的对比图（同一篇文章）

总结一句话区别

相关链接

知识库知识管理系统

这些概念之间的相似性

真实系统中常见的“混着用”例子

一句话总结“相似性”

上一篇

下一篇

小K

发表回复取消回复

联系KMCenter

分类（Category/Classification）、元数据（Metadata）、标签（Tag）、实体（Entity）的属性之间的关系及案例

分类（Category/Classification）、元数据（Metadata）、标签（Tag）、实体（Entity）的属性之间的关系及案例

举一个具体的例子：一篇博客文章《2024年北京冬残奥会冠军张怡宁的励志故事》

更直观的对比图（同一篇文章）

总结一句话区别

相关链接

知识库知识管理系统

这些概念之间的相似性

真实系统中常见的“混着用”例子

一句话总结“相似性”

上一篇

下一篇

小K

发表回复 取消回复

发表回复取消回复