Title
您当前的位置: 首页 > null > 文章详细
从视频到图像:Vidu Q1 参考生图如何攻克‘多主体一致’行业难题?
发布时间:2025-09-09

9 月 9 日,AIGC 赛道明星公司生数科技通过官方账号正式发布 Vidu Q1 参考生图,新功能支持多达 7 张参考图同时输入,达国内多图参考数量上限,并在多主体一致和高还原度方面取得关键突破,实现多人、多场景生成中精准保持主体的面貌与特征。此次发布距离 Google Nano Banana 生图认领发布仅 10 天,且该创业公司首次发布生图产品就坐稳头部,彰显了中国创新 AI 企业在生图核心赛道上已具备与国际巨头正面竞争的自信与实力。

微信图片_20250909110124.png

技术硬实力:设定多图上限,实现万物精准生成

作为 AIGC 赛道的头部玩家,生数科技自成立以来一直备受行业关注。2024 年 4 月,它率先发布中国首个全面对标 Sora 的视频大模型产品 Vidu,并于 7 月正式全球上线。上线 8 个月,其年度经常性收入(ARR)突破 2000 万美元,业务覆盖全球 200 +国家和地区,成为近年来 AI 赛道炙手可热且极具影响力的创新公司之一。而本次官宣推出 Vidu Q1 参考生图,既在意料之外,又在合乎情理之内。

意料之外的是,一直专注在 AI 视频生成领域深耕的 Vidu,事先并未透露任何要进军 AI 生图领域的迹象,发布前甚至未做预热便直接上线 Web 产品,使大厂慌张。合乎情理之处则是在于,作为国内首个提出参考生概念的平台,Vidu 对突破多主体一致性执念颇深,发布如此之快看起来是早有技术储备。公司发言人曾在多个场合表示,多主体一致是实现复杂叙事的前提。AI 生图作为 AI 视频的前站,如果能在一致性上同样取得惊艳效果,则意味着生数科技这家公司已完成产品关键功能布局,为构建下一步更大商业生态奠定坚实基础。

微信图片_20250909110130.png

在 AI 生图领域,“参考图”数量直接决定了创作者对生成结果的控制精度。当前,业内常见的参考生图功能一般支持 1-3 张,极少能做到 4-5 张,而 Vidu Q1 一举将国内常规的 1-3 张参考图上限提升至 7 张乃至更多,直接实现了量级上的跨越。更重要的是,与 Nano Banana、即梦、Flux Context 等模型的生成案例对比,Vidu Q1 参考生图在保持参考图特征的同时,能够保持高还原度,完美贴近用户原始输入,解决行业内其他模型常出现“参考模糊”“相似但不像”的问题,保证“所见即所得”。

在使用中,用户可同时输入人物、场景、道具、风格等多种元素参考图,对最终画面进行精准合成或者替换,最终生成复杂构图、多主体、多元素交互的场景,为专业级内容生产提供强大支持。这一功能也带来了更多创新玩法,如用户可实现与偶像同框合影,或将历史名人“穿越”到现代场景中,体验现代物品,创造强烈的反差感和趣味性,展现文化再生的魅力。

落地真价值:攻克“一致性”痛点,构建商业大生态

不过,很明显的是,Vidu Q1 参考生图的核心优势并不止于娱乐应用,从过往的节奏来看,生数科技的野心并不满足于让 Vidu AI 仅仅作为“辅助工具”存在。相反,将 Vidu 升级为真正的“商业生产力”,似乎才是这家公司真正的目的。

8 月 18 日,利用生数科技 Vidu AI 生成的 50 集动漫短剧《明日周一》正式上线,该剧以“10 人团队+ 45 天+ 50 集”的极效创作模式,上线三天即实现单平台超百万播放,5 天破 500 万的亮眼成绩。创下无流量扶持单平台高播放的 AI 行业纪录。播放数据和付费收入的双重成功,不仅验证了 AI 漫剧的商业化成熟性,也使该剧成为国内 AI 动漫短剧赛道首个商业化现象级案例。此前,该公司还推出了 30 集全 AI 流程制作的《一品布衣》、北京中轴线献礼 AIGC 四部曲《中轴线上的北京》,以及与好莱坞联合制作的 50 集 AI 科幻短剧等多部作品,成为影视动漫 AI 领域落地最快的企业。在广告电商领域,凭借 7 月发布的 Vidu Q1 参考生“1080P +超高一致性”视频功能,目前公开信息可查的是,生数科技已与包括安踏、京东、蓝标、小米、亚马逊、华润等在内的多家行业头部客户达成合作。

或许正是基于前期商业化探索中的显著成果,生数科技将“超高一致性”作为视频大模型的必经之路。Vidu Q1 参考生视频,重点攻克的也是多主体一致,而参考生图的发布,则可以看作是对一致性探索的坚实延续。新发布的 Vidu Q1 参考生图的核心优势在于,能确保多个主体在复杂场景切换下保持绝对一致,人物面貌、服饰细节丝毫不差。这项能力直接切中了电商、广告、影视 IP 开发等高价值行业的刚需,传统拍摄需要的三耗(耗时、耗精力、耗成本)不再成为难题,在产品类广告中,仅需几秒,就可以让商品在不同场景 360°无死角精准展示,达到以假乱真的程度,为企业降本提效提供全新解决方案。

行业新格局:中国 AIGC 技术崛起,定义下一代创作范式

Vidu Q1 参考生图的发布,也直接成为 AI 生图领域的热门事件,当天多次登上行业热门新闻榜。与前几天大火的 Nano Banana 相比,由 Vidu Q1 参考生图创造的 2 个月完成从规划到训练再到产品上线的“中国速度”又一次为人们津津乐道。凭借过硬的技术储备和产品优势,生数科技正与即梦、可灵等国内企业共同推动 AIGC 市场,并与国际巨头展开正面竞争。

在 AI 视频生成领域,以生数科技为代表的中国公司,提供了一种“高质价优”的中国 AI 模式,这为推动 AI 更大规模、更快速度扩展至普通用户提供了有效可能。与国际对手 Veo3、Runway 相比,高额的订阅费从来都是人们快速体验 AI 产品的一大阻碍。AI 生图的推出则让竞争不再停留在性价比,更是中美之间 AI 企业大商业生态比试的重要一环,对于提升中国 AIGC 技术生态自信心,显得尤为重要。

也是在 7 月,生数科技发布与清华大学联合研发的具身视频基座模型 Vidar,它作为视频大模型 Vidu 在具身智能领域延伸的重大突破,是全球首个采用多模态生成模型架构解决物理世界问题,并达到该领域 SOTA 水平的机器人大模型。这不仅彰显了 Vidu 的强大基模能力及其架构的卓越扩展性,也将通过强化对物理世界的认知,反哺 Vidu 在数字世界视频创作中对物理规律的理解与生成能力。

同月,在世界人工智能大会(WAIC)上,生数科技还展示了以 AI 视频生成为样本的硬件设备合作成果——气味播放器及“沉浸式虚拟内容播放”的 VR 设备,并展示了在影视文旅、AI +教育、智能硬件等领域的一系列解决方案。

如此,以视频大模型架构为基础,构建一个更宏大的技术生态,并快速在商业模式中大规模落地应用正成为可能。从 Vidu 参考生视频、参考生图等核心产品的上线,从视频生成到与具身智能模型 Vidar 的结合,从 AI 硬件到影视、互联网等多领域拓展,中国 AI 公司正在展现其“战略眼光+技术储备+商业生态”的长远布局,为下一代人机交互和内容创作范式定义新的世界标准。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

上一篇:
中国品牌引领全球家电品质风潮:TÜV莱茵在IFA 2025首日颁发多项认证
下一篇:
以案说法:花呗借呗催收支付宝成被告 法院认定告错了对象
Title