Title
您当前的位置: 首页 > null > 文章详细
阿里“快乐生蚝”突袭:正面硬刚谷歌 Genie 3「请名人找他山石」
发布时间:2026-04-17

  他山石智库多年积累诸多顶级专家资源,构建了连接海内外顶级学者的学术网络。进入2026年,我们持续推动前沿技术与产业实践的深度碰撞,旨在通过高水平的学术交流与智力支持,为行业变革提供权威指引与决策参考。

  2026 年 4 月 16 日,大模型界迎来了一次“物种爆发”。继此前爆火的 HappyHorse(快乐马)之后,阿里 ATH 创新事业部再度出手,发布了可实时构建与交互的世界模型——HappyOyster(快乐生蚝)。

  如果说传统的文生视频模型是“被动放映机”,那么 HappyOyster 就是一个“主动进化的平行世界”。

  一、核心战力:不仅仅是生成,而是“模拟”

  HappyOyster 与谷歌的Genie 3同属于“世界模拟器”流派。它彻底颠覆了“输提示词→等渲染→得成片”的被动流程,转向了长时序的世界演化建模。

  漫游模式(Wander):无限延展的空间。用户只需一张图或一句话,模型即可生成具备物理一致性的空间。用户能以第一人称视角自由切换方向,突破初始画框。导演模式(Direct):剧情的实时改写。阿里独家的“杀手锏”。用户在视频生成的任意节点,通过语音或文字介入,直接调度角色、改写因果,实现从“围观者”到“造物主”的飞跃。

  二、技术解构:如何让 AI 拥有“常识”?

  世界模型之所以难,是因为它必须理解空间、物理与因果律。参考谷歌 Genie 3 的三段式架构,HappyOyster 在此基础上实现了超越:

  时空视频 Tokenizer:将原始视频序列压缩,实现建模的高效化。自回归 Dynamics 模型:像 LLM 预测下一个字一样,预测世界的下一帧演化。隐式动作模型(Latent Action):学习“如果这样动,世界会如何变”的隐含规律。

  阿里的进化点:HappyOyster 采用了更长跨度的世界演化建模。官方数据显示,它能支持长达1 分钟的连续实时位移,以及3 分钟以上的高质量(480p/720p)导演模式画面生成,画面保真度与风格泛化能力均显著优于前代竞品。

  三、跨越边界:从数字名画到无限宇宙

  在 HappyOyster 的 Demo 中,我们看到了震撼的一幕:

  畅游名画:玩家可以真正“走进”世界名画,在油画质感的空间里漫游,光影随视角实时变化。物理一致性:物体位置稳定、重力感真实,甚至因果律也能持续演化。二创开放:用户生成的数字世界可以被完整保存,并开放给他人进行二次创作,构建出一个不断扩张的 AI 元宇宙。

  四、未来图景:漫游与导演的“无缝融合”

  尽管目前漫游与导演模式尚未完全打通,但阿里的愿景非常明确:未来的用户将实现“边探索、边创造”。你不仅活在 AI 模拟的世界里,还能在漫步时随手改写这个世界的物理规则或剧情走向。

  他山石智库 2015 年来商业合作数百位诺贝尔奖得主、图灵奖得主、两院院士、藤校牛剑院长教授、世界500强领导者、联合国高层及 openai 创始人等人工智能科学家、经济学家、企业家及《未来简史》作者赫拉利;世界首富马斯克母亲梅耶·马斯克等。为北京、上海、杭州、广州、深圳政府举办的国际化论坛、峰会提供演讲嘉宾;为阿里、腾讯、字节、百度等公司大会提供演讲嘉宾,并运营诺贝尔奖专家领衔的品牌代言背书和海外传播。他山石智库还应用独一无二资源,送数百位中国学子去美国常青藤及前三十大学,英国牛津,剑桥等名校留学。创始团队来自国务院发展研究中心、财新、清华、麻省理工。

上一篇:
大行评级丨花旗:对农业银行开启30日上行催化观察,目标价6.94港元
下一篇:
十项重量级合作项目落地 助力南京提升国际性综合交通枢纽能级
Title