知识表示：从人脑到电脑的“知识翻译术”_大白话聊透人工智能_巴蜀魔幻侠

2012年，谷歌提出“知识图谱”，用语义网络的方法把海量知识连起来，形成一张巨大的“知识网”。比如你搜“北京”，知识图谱里不仅有“北京是中国首都”，还有“北京的人口”“北京的景点”“北京的历史”，甚至能关联到“北京冬奥会”“北京烤鸭”，电脑顺着这张网能给你推荐一堆相关知识。

这个阶段的AI能做智能搜索、智能推荐，比如淘宝根据你的浏览记录推荐商品，就是靠知识图谱里的“用户-商品-兴趣”关系。

4. 爆发期（2020s至今）：用“AI”学知识，像教小孩

现在的阶段，知识表示不用“人手动写规则”了，而是让AI自己“学”知识，核心是“神经网络表示法”。

大模型（比如GPT、文心一言）通过学习互联网上的万亿条文本，自动把词语、句子变成向量，还能学会“关系”。比如它从没见过“张三喜欢吃苹果”这句话，但见过“李四喜欢吃香蕉”“王五喜欢吃橘子”，就能通过向量分析，知道“喜欢吃”是人和水果之间的关系。

2024年之后，知识表示开始往“多模态”发展，就是把文字、图片、声音的知识都用向量表示。比如电脑能把“猫”的文字、猫的图片、“喵”的叫声变成相似的向量，这样你发一张猫的图片，它就能知道“这是猫，会叫喵，是动物”。

这个阶段的AI越来越“智能”，能写文章、做设计、回答复杂问题，但也带来了新问题：AI学的知识太多太杂，有时候会“胡说八道”（也就是“幻觉”），因为它只是靠向量匹配，不是真的理解知识。

五、看应用：知识表示离我们不远，生活里到处都是

别以为知识表示是“实验室里的东西”，其实咱们每天都在接触。从手机里的APP到路上的智能设备，背后都有它的影子。咱们挑几个常见的场景，看看它是怎么发挥作用的。

1. 智能搜索：让“搜答案”变成“给结果”

以前搜东西，比如“李白的诗”，会出来一堆网页，得自己翻；现在用百度、谷歌，直接就能看到“李白的代表作：《静夜思》《望庐山瀑布》”，还能关联到“创作背景”“赏析”，这就是知识表示的功劳。

搜索引擎里藏着一张巨大的知识图谱，用语义网络表示法把“李白”“诗”“朝代”这些知识连起来。当你输入问题，电脑先“理解”你的需求（比如“李白的诗”其实是要“李白的代表作及相关信息”），然后在知识图谱里找相关的节点和关系，最后把结果整理成你能看懂的形式。

甚至现在的搜索能处理“模糊问题”，比如你问“《静夜思》的作者是哪个朝代的，他还有啥有名的诗”，电脑能通过知识图谱里的“《静夜思》-作者-李白-朝代-唐朝-作品-《望庐山瀑布》”的关系链，一次性给你答案。

2. 智能推荐：“猜你喜欢”不是瞎猜，是靠知识关联

你在抖音刷到喜欢的视频，下次会推更多类似的；在淘宝买了一件衬衫，会推裤子、领带——这不是“玄学”，是知识表示在背后发力。

推荐系统里用了“面向对象表示法”和“知识图谱”：

- 把你当成一个“用户对象”，属性包括“年龄、性别、浏览记录、购买记录”；

- 把商品当成“商品对象”，属性包括“类型、风格、价格、关联商品”；

- 用知识图谱把“用户-商品-兴趣”连起来，比如“用户A买了衬衫→衬衫属于男装→男装关联裤子→给用户A推裤子”。

比如你在B站看了《流浪地球2》的解说，系统的知识图谱里有“《流浪地球2》-类型-科幻片-关联-《三体》《星际穿越》”，所以会给你推其他科幻片的解说，这就是“知识关联”带来的精准推荐。

3. 智能客服：24小时不睡觉，靠“规则库”接电话

你打银行、运营商的客服电话，经常会先听到“请说您的需求，比如查账单、办业务”，这背后就是“产生式表示法”的功劳。

智能客服的系统里存着几千条“如果…就…”的规则：

- 如果用户说“查账单”，就回复“请提供您的手机号，我为您查询”；

- 如果用户说“办宽带”，就回复“请问您在哪个城市？我们有100M、200M两种套餐”；

- 如果用户说的话匹配不到规则，就转人工客服。

现在的智能客服更高级了，结合了“神经网络表示法”，能理解“同义词”，比如你说“我的话费还有多少”“查一下余额”“话费剩多少了”，它都能匹配到“查账单”的规则，不用你严格按照它给的关键词说。

4. 医疗诊断：当“AI助手”帮医生看片子

在医院里，AI已经能帮医生看CT片、诊断常见病，这背后是“框架表示法”和“知识图谱”的结合。

这章没有结束，请点击下一页继续阅读！