新京报贝壳财经讯(记者罗亦丹)记者9月10日获悉,“清华系”AI公司生数科技旗下视频大模型Vidu正式推出Vidu Q1参考生图功能,以支持7张参考图输入打破国内生成上限,并在一致性、还原度等关键指标上正面对标最近爆火的Nano Banana。
生数科技方面表示,从单图参考到多图参考,是AI生图在一致性上的不断突破,“可以说没有一致性,就没有大规模商业化应用。”不同于单图参考的单一限定条件,Vidu Q1参考生图可以指定人物、场景、道具进行自由创作,通过多个参考对象实现对画面的更强可控。
如下图的“让莱昂纳多坐在霍格沃茨学院的教室里练习魔法。”输入的多张参考图中包含了人物、道具、服饰、配饰等多个主体,场景非常复杂。
从输出的结果来看,Vidu Q1参考生图严格遵循提示词,人物发型、五官均保持与原图一致,每个物品位置摆放正确,且比例合理。左侧亮起的台灯照亮了莱昂纳多的侧脸和桌面上摊开的书本,宠物海德薇站在红色行李箱上毫无违和感,多个主体的融合高度一致。
生数科技方面表示,作为Vidu首款参考生图产品,Vidu Q1一经推出便实现对谷歌Nano Banana的全面对标,在AI生图这一巨头云集的赛道中展现出中国创业公司的硬核技术实力。Vidu Q1参考生图的发布,是中国AI多模态领域的一次重要突破。它证明了中国团队不仅能够紧跟国际发展,更能在关键技术上实现差异化创新甚至局部超越。
校对 穆祥桐
相关文章
2025-09-110阅读
2025-09-110阅读
2025-09-110阅读
2025-09-110阅读
2025-09-110阅读
2025-09-110阅读
2025-09-110阅读
2025-09-110阅读
2025-09-110阅读
2025-09-110阅读