文章详细-从视频到图像：Vidu Q1 参考生图如何攻克‘多主体一致’行业难题？

9 月 9 日，AIGC 赛道明星公司生数科技通过官方账号正式发布 Vidu Q1 参考生图，新功能支持多达 7 张参考图同时输入，达国内多图参考数量上限，并在多主体一致和高还原度方面取得关键突破，实现多人、多场景生成中精准保持主体的面貌与特征。此次发布距离 Google Nano Banana 生图认领发布仅 10 天，且该创业公司首次发布生图产品就坐稳头部，彰显了中国创新 AI 企业在生图核心赛道上已具备与国际巨头正面竞争的自信与实力。

微信图片_20250909110124.png

技术硬实力：设定多图上限，实现万物精准生成

作为 AIGC 赛道的头部玩家，生数科技自成立以来一直备受行业关注。2024 年 4 月，它率先发布中国首个全面对标 Sora 的视频大模型产品 Vidu，并于 7 月正式全球上线。上线 8 个月，其年度经常性收入（ARR）突破 2000 万美元，业务覆盖全球 200 +国家和地区，成为近年来 AI 赛道炙手可热且极具影响力的创新公司之一。而本次官宣推出 Vidu Q1 参考生图，既在意料之外，又在合乎情理之内。

意料之外的是，一直专注在 AI 视频生成领域深耕的 Vidu，事先并未透露任何要进军 AI 生图领域的迹象，发布前甚至未做预热便直接上线 Web 产品，使大厂慌张。合乎情理之处则是在于，作为国内首个提出参考生概念的平台，Vidu 对突破多主体一致性执念颇深，发布如此之快看起来是早有技术储备。公司发言人曾在多个场合表示，多主体一致是实现复杂叙事的前提。AI 生图作为 AI 视频的前站，如果能在一致性上同样取得惊艳效果，则意味着生数科技这家公司已完成产品关键功能布局，为构建下一步更大商业生态奠定坚实基础。

微信图片_20250909110130.png

在 AI 生图领域，“参考图”数量直接决定了创作者对生成结果的控制精度。当前，业内常见的参考生图功能一般支持 1-3 张，极少能做到 4-5 张，而 Vidu Q1 一举将国内常规的 1-3 张参考图上限提升至 7 张乃至更多，直接实现了量级上的跨越。更重要的是，与 Nano Banana、即梦、Flux Context 等模型的生成案例对比，Vidu Q1 参考生图在保持参考图特征的同时，能够保持高还原度，完美贴近用户原始输入，解决行业内其他模型常出现“参考模糊”“相似但不像”的问题，保证“所见即所得”。

在使用中，用户可同时输入人物、场景、道具、风格等多种元素参考图，对最终画面进行精准合成或者替换，最终生成复杂构图、多主体、多元素交互的场景，为专业级内容生产提供强大支持。这一功能也带来了更多创新玩法，如用户可实现与偶像同框合影，或将历史名人“穿越”到现代场景中，体验现代物品，创造强烈的反差感和趣味性，展现文化再生的魅力。

落地真价值：攻克“一致性”痛点，构建商业大生态

不过，很明显的是，Vidu Q1 参考生图的核心优势并不止于娱乐应用，从过往的节奏来看，生数科技的野心并不满足于让 Vidu AI 仅仅作为“辅助工具”存在。相反，将 Vidu 升级为真正的“商业生产力”，似乎才是这家公司真正的目的。

8 月 18 日，利用生数科技 Vidu AI 生成的 50 集动漫短剧《明日周一》正式上线，该剧以“10 人团队+ 45 天+ 50 集”的极效创作模式，上线三天即实现单平台超百万播放，5 天破 500 万的亮眼成绩。创下无流量扶持单平台高播放的 AI 行业纪录。播放数据和付费收入的双重成功，不仅验证了 AI 漫剧的商业化成熟性，也使该剧成为国内 AI 动漫短剧赛道首个商业化现象级案例。此前，该公司还推出了 30 集全 AI 流程制作的《一品布衣》、北京中轴线献礼 AIGC 四部曲《中轴线上的北京》，以及与好莱坞联合制作的 50 集 AI 科幻短剧等多部作品，成为影视动漫 AI 领域落地最快的企业。在广告电商领域，凭借 7 月发布的 Vidu Q1 参考生“1080P +超高一致性”视频功能，目前公开信息可查的是，生数科技已与包括安踏、京东、蓝标、小米、亚马逊、华润等在内的多家行业头部客户达成合作。

或许正是基于前期商业化探索中的显著成果，生数科技将“超高一致性”作为视频大模型的必经之路。Vidu Q1 参考生视频，重点攻克的也是多主体一致，而参考生图的发布，则可以看作是对一致性探索的坚实延续。新发布的 Vidu Q1 参考生图的核心优势在于，能确保多个主体在复杂场景切换下保持绝对一致，人物面貌、服饰细节丝毫不差。这项能力直接切中了电商、广告、影视 IP 开发等高价值行业的刚需，传统拍摄需要的三耗（耗时、耗精力、耗成本）不再成为难题，在产品类广告中，仅需几秒，就可以让商品在不同场景 360°无死角精准展示，达到以假乱真的程度，为企业降本提效提供全新解决方案。

行业新格局：中国 AIGC 技术崛起，定义下一代创作范式

Vidu Q1 参考生图的发布，也直接成为 AI 生图领域的热门事件，当天多次登上行业热门新闻榜。与前几天大火的 Nano Banana 相比，由 Vidu Q1 参考生图创造的 2 个月完成从规划到训练再到产品上线的“中国速度”又一次为人们津津乐道。凭借过硬的技术储备和产品优势，生数科技正与即梦、可灵等国内企业共同推动 AIGC 市场，并与国际巨头展开正面竞争。

在 AI 视频生成领域，以生数科技为代表的中国公司，提供了一种“高质价优”的中国 AI 模式，这为推动 AI 更大规模、更快速度扩展至普通用户提供了有效可能。与国际对手 Veo3、Runway 相比，高额的订阅费从来都是人们快速体验 AI 产品的一大阻碍。AI 生图的推出则让竞争不再停留在性价比，更是中美之间 AI 企业大商业生态比试的重要一环，对于提升中国 AIGC 技术生态自信心，显得尤为重要。

也是在 7 月，生数科技发布与清华大学联合研发的具身视频基座模型 Vidar，它作为视频大模型 Vidu 在具身智能领域延伸的重大突破，是全球首个采用多模态生成模型架构解决物理世界问题，并达到该领域 SOTA 水平的机器人大模型。这不仅彰显了 Vidu 的强大基模能力及其架构的卓越扩展性，也将通过强化对物理世界的认知，反哺 Vidu 在数字世界视频创作中对物理规律的理解与生成能力。

同月，在世界人工智能大会（WAIC）上，生数科技还展示了以 AI 视频生成为样本的硬件设备合作成果——气味播放器及“沉浸式虚拟内容播放”的 VR 设备，并展示了在影视文旅、AI +教育、智能硬件等领域的一系列解决方案。

如此，以视频大模型架构为基础，构建一个更宏大的技术生态，并快速在商业模式中大规模落地应用正成为可能。从 Vidu 参考生视频、参考生图等核心产品的上线，从视频生成到与具身智能模型 Vidar 的结合，从 AI 硬件到影视、互联网等多领域拓展，中国 AI 公司正在展现其“战略眼光+技术储备+商业生态”的长远布局，为下一代人机交互和内容创作范式定义新的世界标准。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。