智谱发布首个手机智能体,支持语音点外卖、订机票,手表、眼镜、家电等均可接入。
从发红包到点外卖,看似相距甚远的AIAgent(智能体)正逐步融入人们的日常生活。只需通过语音发出指令“找附近奶茶店下单20杯并用优惠券”,系统便可自动完成跳过广告、选择品类、确认数量、使用红包等一系列操作,消费者只需在支付环节点击确认,就能轻松实现“用AI点外卖”。 这种技术的应用,不仅提升了效率,也改变了用户的消费体验。随着人工智能技术的不断成熟,未来这类智能体或将更加普及,成为日常生活中不可或缺的一部分。它所代表的不仅是技术的进步,更是服务模式的革新,值得我们持续关注与思考。
8月20日,AI独角兽企业智谱推出全球首款手机端智能体AutoGLM2.0,智谱AICEO张鹏向澎湃新闻记者演示了通过智能体点外卖的功能。
据智谱介绍,这是全球首个可在任何设备、任何场景下运行的手机Agent,突破了传统硬件的限制,能够为用户提供代理操作服务。该系统由纯国产模型驱动,包括GLM-4.5和GLM-4.5V,具备强大的推理能力、代码生成以及多模态处理功能,展现出全面的技术实力。 从技术发展的角度看,这一突破标志着国产AI在移动端应用上的重要进展,不仅提升了用户体验,也展现了国内技术自主化的能力。随着人工智能逐步渗透到日常生活的各个角落,这样的创新无疑将推动行业向更智能、更便捷的方向发展。
尽管大型模型已经广为人知,但由大模型衍生出的“智能体”似乎对普通大众而言仍显得有些遥远。
AI业内的共识是,2025年是智能体元年。如果说大模型像“搜索引擎”,智能体就是“智能助手”,不仅能理解指令表层语义,更能捕捉隐含需求,可以根据用户的简单命令完成较为复杂的操作——粗略理解,智能体就像私人秘书,只需要一个指令,就能直接完成用户心中的需求。
国内首款引发广泛关注的智能体产品是Manus,推出后迅速走红,但也伴随着诸多争议。此后,包括智谱、腾讯、百度等科技企业纷纷布局智能体领域,加速推进相关产品的研发与落地。其中,智谱在今年持续推出更新版本的智能体产品AutoGLM,迭代速度之快反映出其对这一赛道的高度关注与投入。 从行业发展趋势来看,智能体正逐渐成为科技竞争的新焦点。尽管Manus作为先行者遭遇了质疑,但它的出现为后续企业提供了参考与借鉴。随着更多大厂的加入,智能体技术有望在应用场景、用户体验等方面实现进一步突破。不过,如何平衡技术创新与社会接受度,仍是行业需要长期思考的问题。
张鹏向澎湃新闻记者表示,未来个人竞争力会是自身能力和N个AI智能体的集合,“会沟通、会安排任务、会指挥”成为核心能力,每个人都会成为“领导”而非“打工者”。具体到AutoGLM2.0的应用,他介绍,只需一句话,就能让AutoGLM操作抖音、小红书、美团、京东等几十个高频应用,实现点外卖、订机票、查房源、预约健康服务等“刚需”操作。
值得注意的是智能体带来的应用生态——据智谱透露,已将 AutoGLM的操作执行能力封装为API,开发者只需简单接入,即可将这一能力融入各类硬件设备。
这意味着,除手机与电脑外,手表、眼镜、家电等设备都能成为智能体驱动的智能助手——例如可以用智能眼镜直接点一杯咖啡,无疑将带来更大想象空间。
在成本方面,传统基于API的DeepResearchAgent单次成本约3–5美元(约20–40元),而AutoGLM(含模型虚拟机)单次成本约为0.2美元(约1.5元),以此估算,成本降低了约93%。这一显著下降表明,随着技术的进步,AI研究和应用的成本正在快速降低,未来仍有进一步优化的空间。这不仅提升了技术的可及性,也为更多企业和研究机构提供了更经济高效的解决方案。
尽管资本市场看好相关智能体发布,另一方面,AI行业的赛马日益加剧,开源大模型洗牌也愈发激烈。
就在智谱发布最新智能体之际,DeepSeek悄然上线了新一代大模型DeepSeekV3.1。此次升级带来的新功能引起了广泛关注,澎湃新闻记者注意到,目前该模型已在HuggingFace趋势榜排名第三。 从当前市场反应来看,DeepSeekV3.1的推出显示出其在技术实力和产品迭代上的持续投入。在AI领域竞争日益激烈的背景下,能够进入HuggingFace趋势榜前三,说明该模型具备一定的影响力和技术认可度。这一进展也反映出国内大模型厂商在技术创新与生态建设方面的积极布局。
DeepSeekV3.1的一项重要升级是将上下文窗口从原来的64k扩展到了128k,这意味着它能够处理更长的文档和代码内容,并在回答时提供更加丰富和详细的信息,语气也更加生动活泼。在技术架构方面,V3.1延续了DeepSeekV3系列的核心技术,如MLA和MoE等,其参数量与V3版本保持一致。
V3.1在编程任务中展现出卓越的能力。根据社区使用Aider测试的数据,1在AiderPolyglot多语言编程测试中取得了71.6%的高分,表现优于Claude4Opus和DeepSeekR1等模型。在SVGBench基准测试中,其成绩仅略逊于GPT-4.1-mini,明显超越了DeepSeekR1。 从技术发展的角度来看,1在多个关键指标上的优异表现,反映出其在代码生成与理解方面的强大能力。这不仅为开发者提供了更高效的工具选择,也推动了AI在软件开发领域的进一步应用。随着多语言支持和复杂任务处理能力的提升,类似模型的应用前景将更加广阔。
就在半个月前,此前曾火爆全网的DeepSeekR1已悄然退出Hugging-Face趋势热榜前十,随着新模型不断推出,榜单更新速度加快,热度更替愈发频繁。 从当前情况看,AI领域的发展节奏明显加快,新产品层出不穷,用户关注点也在快速转移。这反映出技术迭代的高速度以及市场对创新产品的持续渴求。同时,也说明了在这一竞争激烈的赛道中,唯有不断突破才能保持热度与影响力。