2012年,谷歌提出“知识图谱”,用语义网络的方法把海量知识连起来,形成一张巨大的“知识网”。比如你搜“北京”,知识图谱里不仅有“北京是中国首都”,还有“北京的人口”“北京的景点”“北京的历史”,甚至能关联到“北京冬奥会”“北京烤鸭”,电脑顺着这张网能给你推荐一堆相关知识。
这个阶段的AI能做智能搜索、智能推荐,比如淘宝根据你的浏览记录推荐商品,就是靠知识图谱里的“用户-商品-兴趣”关系。
4. 爆发期(2020s至今):用“AI”学知识,像教小孩
现在的阶段,知识表示不用“人手动写规则”了,而是让AI自己“学”知识,核心是“神经网络表示法”。
大模型(比如GPT、文心一言)通过学习互联网上的万亿条文本,自动把词语、句子变成向量,还能学会“关系”。比如它从没见过“张三喜欢吃苹果”这句话,但见过“李四喜欢吃香蕉”“王五喜欢吃橘子”,就能通过向量分析,知道“喜欢吃”是人和水果之间的关系。
2024年之后,知识表示开始往“多模态”发展,就是把文字、图片、声音的知识都用向量表示。比如电脑能把“猫”的文字、猫的图片、“喵”的叫声变成相似的向量,这样你发一张猫的图片,它就能知道“这是猫,会叫喵,是动物”。
这个阶段的AI越来越“智能”,能写文章、做设计、回答复杂问题,但也带来了新问题:AI学的知识太多太杂,有时候会“胡说八道”(也就是“幻觉”),因为它只是靠向量匹配,不是真的理解知识。
五、看应用:知识表示离我们不远,生活里到处都是
别以为知识表示是“实验室里的东西”,其实咱们每天都在接触。从手机里的APP到路上的智能设备,背后都有它的影子。咱们挑几个常见的场景,看看它是怎么发挥作用的。
1. 智能搜索:让“搜答案”变成“给结果”
以前搜东西,比如“李白的诗”,会出来一堆网页,得自己翻;现在用百度、谷歌,直接就能看到“李白的代表作:《静夜思》《望庐山瀑布》”,还能关联到“创作背景”“赏析”,这就是知识表示的功劳。
搜索引擎里藏着一张巨大的知识图谱,用语义网络表示法把“李白”“诗”“朝代”这些知识连起来。当你输入问题,电脑先“理解”你的需求(比如“李白的诗”其实是要“李白的代表作及相关信息”),然后在知识图谱里找相关的节点和关系,最后把结果整理成你能看懂的形式。
甚至现在的搜索能处理“模糊问题”,比如你问“《静夜思》的作者是哪个朝代的,他还有啥有名的诗”,电脑能通过知识图谱里的“《静夜思》-作者-李白-朝代-唐朝-作品-《望庐山瀑布》”的关系链,一次性给你答案。
2. 智能推荐:“猜你喜欢”不是瞎猜,是靠知识关联
你在抖音刷到喜欢的视频,下次会推更多类似的;在淘宝买了一件衬衫,会推裤子、领带——这不是“玄学”,是知识表示在背后发力。
推荐系统里用了“面向对象表示法”和“知识图谱”:
- 把你当成一个“用户对象”,属性包括“年龄、性别、浏览记录、购买记录”;
- 把商品当成“商品对象”,属性包括“类型、风格、价格、关联商品”;
- 用知识图谱把“用户-商品-兴趣”连起来,比如“用户A买了衬衫→衬衫属于男装→男装关联裤子→给用户A推裤子”。
比如你在B站看了《流浪地球2》的解说,系统的知识图谱里有“《流浪地球2》-类型-科幻片-关联-《三体》《星际穿越》”,所以会给你推其他科幻片的解说,这就是“知识关联”带来的精准推荐。
3. 智能客服:24小时不睡觉,靠“规则库”接电话
你打银行、运营商的客服电话,经常会先听到“请说您的需求,比如查账单、办业务”,这背后就是“产生式表示法”的功劳。
智能客服的系统里存着几千条“如果…就…”的规则:
- 如果用户说“查账单”,就回复“请提供您的手机号,我为您查询”;
- 如果用户说“办宽带”,就回复“请问您在哪个城市?我们有100M、200M两种套餐”;
- 如果用户说的话匹配不到规则,就转人工客服。
现在的智能客服更高级了,结合了“神经网络表示法”,能理解“同义词”,比如你说“我的话费还有多少”“查一下余额”“话费剩多少了”,它都能匹配到“查账单”的规则,不用你严格按照它给的关键词说。
4. 医疗诊断:当“AI助手”帮医生看片子
在医院里,AI已经能帮医生看CT片、诊断常见病,这背后是“框架表示法”和“知识图谱”的结合。
这章没有结束,请点击下一页继续阅读!