Title
您当前的位置: 首页 > > 文章详细
全球AI竞赛新赛点:从让AI助手点杯奶茶开始
发布时间:2026-01-21

  过去十年,移动互联网的流量入口经历了从搜索引擎到超级 App 的变迁。而在 AI 智能体时代,入口的定义或将再次被改写。

  文|北野

  阿里终究还是快人一步。

  1 月 15 日,阿里巴巴旗下千问 App 全面接入淘宝、支付宝、淘宝闪购等阿里生态业务,并向所有用户开放测试,成为全球首个能完成真实生活复杂任务的 AI 助手,同时宣告着全球 AI 竞赛驶入了一条新赛道。

  就在千问升级的两天前,谷歌刚刚在美国国家零售联合会(NRF)年会上,推出了一份旨在彻底重塑未来 AI 智能体购物体验的开放标准,并表示正在与大型零售商合作,计划将聊天机器人 Gemini 变为一个虚拟商家和购物助手。

  而在这份协议落地的两天后,大洋彼岸的中国用户已经只需要动动嘴,千问 App 就能帮忙实现点奶茶、网购、订机票等 AI 购物需求,并完成推荐、下单以及支付的"一条龙"服务。率先引领着行业从"聊天对话"迈入"办事时代"。

  从"超级 App"到"超级智能体",千问何以重新定义 AI 助手?"连接者"到"执行者"的角色转变背后,AI 助手的底层逻辑发生了怎样的变化?又将给行业带来哪些启示?

  从连接者到执行者

  AI 助手的起源最早可追溯到上个世纪 60 年代。由麻省理工学院开发出的聊天机器人—— ELIZA,它能通过预设一些关键词和回复模板,来模拟与用户的对话,虽然工作原理基于简单的模式匹配和替换规则,但却第一次让人们看到了计算机与人类对话的可能性。

  进入 21 世纪,苹果公司成功推出为 iPhone 量身定做的智能手机助手 Siri,一经问世便迅速风靡全球,也让 AI 助手的概念真正走入大众视野。尽管 Siri 的创新足够惊艳,但始终没有迈出真正成为人工智能的一步,其核心能力一直停留在语音对话问答阶段。

  直到生成式 AI 的井喷,让 AI 助手终于有了些人工智能的样子。更换"超级大脑"后的 AI 助手,几乎可以帮助用户处理任何工作、学习中遇到的难题,但唯独用户口渴想让它帮忙点杯奶茶时,跳转的页面再次将其价值局限在流程简化的起点。

  过去几年,无论引领了智能助手潮流的 Siri,亦或是进化升级的 ChatGPT,其核心交互模式始终是"提问-回答"。它们可以是博学的顾问、高效的内容生成者,但在面对"订一份最快送达的午餐"这类需要调用外部服务、完成支付与履约的复杂任务时,更多扮演的是一个"连接者"的角色——"理解指令-给出建议-跳转页面",然后再将用户"踢"回现实世界。

  如今,真正长出"手脚"能帮用户办事的 AI 助手终于诞生了。

  1 月 15 日的发布会现场,与会观众共同见证了这一变革性的时刻:千问 C 端事业群总裁吴嘉仅通过语音下达"帮我点 40 杯霸王茶姬"的指令,没有跳转至外卖平台,没有复杂的商品浏览界面,仅在千问 App 内确认、支付,一分钟后订单生成,约四十分钟后,淘宝闪购的骑手将奶茶送达会场。

  这个看似简单的场景,精准地切中了传统 AI 助手的能力天花板。"帮我点杯奶茶"这种指令,能在千问内部触发一个精密的自动化链条:定位、筛选附近商家、调用淘宝闪购服务生成订单、通过集成的"支付宝 AI 付"完成支付。从意图理解到服务履约,形成了一个端到端的闭环,标志着 AI 助手的核心价值,从"信息与知识的连接"质变为"任务与服务的执行"。

  除了点外卖、网购,在更复杂的生活场景中,千问同样展现出令人印象深刻的跨应用协同能力。规划春节家庭出游时,它能同时调用飞猪预订机票酒店,调用高德规划行程并预订年夜饭,甚至能直接模拟真人声音帮用户打电话订餐厅。

  这些能力源于千问底层技术的三重突破:编码能力的提升使其能实时构建并调用工具;全模态理解能力的突破让其能同步解析界面、语音、图文及报表信息;超长上下文处理能力显著增强了复杂任务的执行上限。

  千问的突破宣告着 AI 助手不再困在屏幕内做"文字顾问",而是真正长出了触达真实世界的"手和脚",开始触及外卖、购物、出行、住宿等高频生活场景。

  生态即模型

  事实上,除了不久前刚宣布要将沃尔玛及山姆会员店的商品整合进 Gemini 的谷歌之外,引领人工智能从量变走向质变的 ChatGPT 也早在去年就推出了"即时结账"功能,迈出了推动 AI 消费闭环的一步。

  然而,两者目前在 AI 消费商业方面的进程仍处于计划的实施以及部分功能的测试之中。事实证明,想让用户在 AI 助手 App 上下单一杯奶茶并非想象中那般容易,根本矛盾在于背后涉及到 AI 对话模型、电商平台、支付机构网关等多个割裂的系统与渠道。

  谷歌日前在 NRF 年会上推出的通用商务协议(简称 UCP),正是为了打破这一桎梏而诞生——通过构建一套开放标准,让不同的 AI 助手能够以统一方式,跨平台完成从商品发现到支付的全链路购物。

  而在中国,支付宝所发布的 ACT 协议(智能体商业信任协议),已在千问 App 实现"一句话买奶茶"的闭环验证,全程无需跳转第三方应用。这是中国首个面向 Agent 商业需求的开放协议,为跨平台、跨终端的 AI 协同提供涵盖授权、交互、支付与信任的统一标准。

  这恰恰也解释了为何千问能在短短两年时间,便能先一步实现从超级 App 到超级智能体的跃迁。因其背靠阿里这座大山,不仅有着通义千问这一强大技术基座,更深层的支撑来自阿里独一无二的商业护城河生态。

  纵观全球互联网科技巨头,鲜有如阿里这般同时拥有完整且深度协同的业务生态。该生态不仅覆盖了从消费到产业、从线上到线下的全链路,更通过"商品流+资金流+物流"的三流合一闭环,形成了"全而强"的独特竞争优势。

  这一优势在接入阿里生态后的千问身上体现得淋漓尽致。当用户提出"给父母买台扫地机器人,预算 2000-4000 元,家里有只猫"这样的模糊需求时,千问能精准推理出"防毛发缠绕""操作简单适合老人"等隐含刚需。能力背后是阿里独特的交易和服务数据对模型的增强。

  而当千问需要规划"从公司到家途中顺便取快递、买晚餐食材"这样的复合任务时,它可以无缝调度菜鸟裹裹的取件信息、高德的实时路况和盒马的生鲜库存数据。其他 AI 玩家无法复制这种能力,不是因为技术差距,而是缺少这样完整且数据互通的业务生态矩阵。

  这也形成了一个当前商业发展大势所趋的业态现象:在 AI 智能体时代,"生态厚度"本身已然成为一种特殊的"模型参数",影响着行业的发展走向。

  AI 智能体时代的"入口之战"

  当下,千问的进化率先吹响了 AI 智能体时代的号角,从而触发了一场静默而深刻的流量再分配革命。过去十年,移动互联网的流量入口经历了从搜索引擎到超级 App 的变迁。而在 AI 智能体时代,入口的定义或将再次被改写。

  在吴嘉看来,未来两年占数字世界 60%— 70%的常规任务,都会由 AI 来直接执行和交付。而早在 2025 年 9 月,阿里就已决定全力推动"千问 App"这一 C 端 AI 项目,被外界视为阿里在 AItoC 领域的重要落子。

  去年 11 月,千问 App 正式上线,不到 2 个月,千问 C 端的月活跃用户就已突破一个亿。千问背后的阿里大生态,成为其在 AI to C 战场迅速突围的关键。

  当未来演变成用户一句话描述需求,系统在后头完成所有操作,然后返回结果这种理想状态时,传统的广告变现逻辑将会被彻底颠覆,入口的价值评估标准也将从"用户停留时长"转向"任务完成效率"。

  在超级 App 时代,平台通过丰富功能和内容尽可能延长用户使用时间,因为时长直接关联广告变现价值。但 AI 智能体追求的是相反目标——用最短时间、最少交互帮助用户完成任务。

  同时意味着流量入口的定义从"一个场景"变成了"一句话",传统的应用商店、搜索乃至超级 App 的入口地位都将受到冲击。这也直接引发了全球新一代流量入口的争夺,谁能占据先机,谁就拥有了流量资源再分配的主动权。

  眼下,全球互联网科技巨头都在加速布局 AI 智能体走向商业闭环的脚步。

  海外市场,以谷歌为代表,正在尝试探索一条"开放协议"之路。其野心在于构建一个跨平台的 AI 购物生态,让 Gemini 成为聚合流量的新枢纽。然而,这条道路面临跨公司协作、数据标准统一与利益分配的长期挑战。

  而在国内,则是以千问为代表的"生态内聚"模式,凭借阿里生态的完整性与闭环能力,在"生活办事"的广度和深度上率先起跑。过往经验表明,中国互联网公司更擅长在复杂商业场景中打磨技术。

  可以确定的是,千问的突破已经将全球 AI 竞赛推入一个全新阶段,未来的竞争可能不再是单一 AI 能力的比拼,而是"大模型+生态厚度"的复合竞赛。

上一篇:
周四开播,嘉宾阵容揭秘!当AI遇上精准医疗,如何实现从“赋能”到“重塑”?
下一篇:
CES 2026!海淀天团闪耀世界舞台,加速AI融入现实世界
Title