智谱开源autoGLM:全球首个“会玩手机”的AI

作品:大白话聊透人工智能|作者:巴蜀魔幻侠|分类:其他|更新:2025-12-15 13:55:03|字数:16750字

而且这个“大脑”还很灵活,能根据实际情况调整计划。比如提取微信客户需求时,发现有个客户的需求不明确,它不会硬着头皮继续,而是会给你发提示“客户A提到的‘项目进度加快’,没有明确具体时间节点,是否需要我询问客户确认?”,等你回复后再继续操作。这种“遇到问题会沟通”的能力,让它不像一个冰冷的机器,更像一个靠谱的同事。

另外,GLM 4.5语言模型还有个厉害之处——能处理长链路任务。比如你让它做一份“全球元宇宙游戏市场”的行业分析报告,它会先打开浏览器搜索最新数据,再打开Excel整理表格,然后打开WPS撰写报告,最后发送到你的邮箱,整个过程涉及十几个步骤,耗时可能几十分钟,但它能一步步有条不紊地完成,不会中途忘记或出错。这得益于它强大的逻辑推理能力和记忆能力,能把复杂任务的每个环节都记在“脑子里”,确保执行连贯。

2. GLM 4.5视觉推理模型:AI的“火眼金睛”,能看懂、会定位

如果说语言模型是“大脑”,那GLM 4.5视觉推理模型就是autoGLM的“眼睛”,它的核心能力是“看懂手机屏幕”。很多人可能会疑惑:AI没有眼睛,怎么知道哪里是按钮、哪里是输入框?这就全靠视觉推理模型了。

这个“眼睛”能精准识别手机屏幕上的所有元素——不管是APP图标、按钮、输入框,还是文字、图片、图表,它都能一一辨认。比如打开淘宝APP,它能一眼认出“搜索框”在顶部,“购物车”图标在右上角,“我的订单”在底部导航栏;在美团APP里,它能区分“外卖”“团购”“买菜”三个入口,还能看懂菜品的名称、价格、评分,甚至能识别“已售罄”“免配送费”这样的标签。

更厉害的是,它还能理解屏幕上的逻辑关系。比如你让它“在淘宝上找一双男士运动鞋,价格在500元以内,评分4.8分以上,销量前10名”,它会先点击淘宝的搜索框,输入“男士运动鞋”,然后在筛选栏里找到“价格”选项,输入“0-500”,再找到“评分”选项,勾选“4.8分以上”,最后按“销量”排序,筛选出符合条件的商品。整个过程中,它需要看懂筛选栏里的各个选项,知道“价格”“评分”“销量”的位置和操作方式,这就像人看书一样,不仅能看到文字,还能理解文字的意思和逻辑。

而且这个“眼睛”还能适应不同的手机界面——不管你用的是安卓还是苹果手机,不管APP是竖屏还是横屏,不管字体大小有没有调整,它都能准确识别。这得益于它在训练时接触了大量的手机屏幕截图和界面数据,已经能应对各种复杂的界面情况。就像我们人类不管看什么手机,都能很快找到自己需要的功能一样,autoGLM的“眼睛”也具备这种通用的识别能力。

正是“大脑”和“眼睛”的完美配合,让autoGLM能像真人一样操作手机。语言模型负责想“要做什么、怎么做”,视觉推理模型负责看“在哪里做、怎么点”,两者协同工作,就能完成各种复杂的跨APP任务。

三、50+高频应用全覆盖:生活、办公,AI全帮你搞定

autoGLM的厉害之处,不仅在于能操作手机,还在于它覆盖了我们日常最常用的应用场景。目前它已经适配了超过50个高频中文应用,涵盖生活服务和办公场景两大领域,不管是吃穿住行,还是上班干活,它都能成为你的“得力助手”。

1. 生活服务场景:解放双手,让生活更省心

生活里的很多琐事,现在都能交给autoGLM来做,不用再在各个APP之间来回切换,省出更多时间做自己想做的事。

外卖点单&生鲜采购:这是最常用的功能之一。你可以说“帮我点一份麦当劳的麦辣鸡腿堡套餐,不要可乐,换成雪碧”,它会打开美团或饿了么APP,找到对应的餐厅和套餐,修改饮品后下单;也可以说“帮我在盒马鲜生上买一斤草莓、两斤西红柿、一瓶牛奶,明天早上送到家”,它会打开盒马APP,选好商品,设置配送时间,完成下单。如果你有忌口或偏好,比如“不吃香菜”“喜欢微辣”,只要提前告诉它,它会每次都自动避开,比自己下单还贴心。

交通出行&票务预订:不管是订机票、火车票,还是打车、查路线,它都能搞定。你说“帮我订后天下午3点从上海到广州的高铁票,选二等座,靠窗的位置”,它会打开APP,搜索车次,筛选靠窗座位,帮你填好乘车人信息,最后提醒你支付;你要出门时,说“帮我叫一辆滴滴快车,从公司到家里,现在出发”,它会打开滴滴APP,自动定位你的位置,设置目的地,叫车成功后告诉你司机信息和预计到达时间;甚至你去陌生地方,说“帮我查一下从这里到故宫的地铁线路,避开早高峰”,它会打开高德或百度地图,搜索最优路线,还会提醒你哪个时间段人少。

本小章还未完,请点击下一页继续阅读后面精彩内容!

上一页目 录下一页
先看到这(加入书签) | 推荐本书 | 我的书架

如果您喜欢,请把《大白话聊透人工智能》,方便以后阅读大白话聊透人工智能智谱开源autoGLM:全球首个“会玩手机”的AI后的更新连载!
如果你对大白话聊透人工智能智谱开源autoGLM:全球首个“会玩手机”的AI并对大白话聊透人工智能章节有什么建议或者评论,请后台发信息给管理员。