关闭广告

清华×生数研发国产视频具身基座模型Vidar,实现少样本泛化突破

网易科技报道2025-07-26 00:00:014880人阅读

7月25日,清华大学与生数科技联合发布模型。据介绍,作为视频大模型Vidu在智能领域延伸的重大突破,Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身模型。该模型创新性地构建了支持双臂协同任务的多视角视频预测框架,在保持SOTA性能的同时,展现出显著的少学习优势。

Vidar可在仅20分钟少样本训练下,泛化至全新机器人本体,完成多视角双臂操作任务,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一。相比以往依赖百万级动作数据的机器人控制模型,Vidar显著降低了数据门槛与训练成本。


该模型基于生数科技此前推出的视频大模型Vidu,在此基础上融入75万条双臂机器人具身数据,构建统一观测空间后进行预训练,并结合自动化动作采集与逆动力学解码器,实现从视频预测到动作控制的全链路闭环。

清华与生数科技团队还提出“任务无关动作数据”训练范式,通过ATARA方法自动采集机器人动作轨迹,仅需10小时,即可完成机器人动作空间泛化。配合高精度动作执行模型AnyPos,Vidar在实际任务中实现近100%成功率,精度远超当前行业基线33%~44%。


Vidar在VBench视频生成测试中,在主体一致性、背景还原与画面质量等维度均显著领先。结合测试时扩展机制(Test-Time Scaling),模型可根据具体任务智能调节生成预测,进一步提高真实场景下的执行稳定性。

研究团队表示,Vidar打破了现有VLA架构对特定机器人任务数据的依赖,首次构建了“通用视频-中等具身视频-少量本体数据”的三级训练框架,推动了具身智能向“虚实互通”的下一阶段演进。未来,Vidar可广泛应用于居家、医院、工厂等场景。

生数科技创始人兼首席科学家朱军教授表示:"我们致力于通过多模态大模型技术推动数字世界与物理世界的深度融合与协同进化。一方面,我们正在打造新一代数字内容创作引擎,让AI成为人类创意的延伸;另一方面,我们通过训练具身视频基座模型,实现虚拟与现实的深度交互。"(袁宁)

本文来自网易科技报道,更多资讯和深度内容,关注我们。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

跟队:梅西的停赛可以战略性选择场次,而非下场对辛辛那提停赛

直播吧 浏览 5767 07-24

鸿蒙智行开启智界品牌标识纪念品免费赠送活动

IT之家 浏览 3876 07-15

居然智家董事长突然离世,家居行业到底发生了什么?

郭施亮 浏览 4646 07-29

特朗普:取消与普京在布达佩斯的会面

央视新闻客户端 浏览 9 10-24

周先旺被查 疫情时曾面对央视镜头提到"革职以谢天下"

界面新闻 浏览 2477 07-09

泰晤士报:里昂有意利物浦22岁中场莫顿,已和红军进行了接触

直播吧 浏览 2561 07-30

官方:纽卡后卫刘易斯-米利当选英联杯1/4决赛最佳球员

懂球帝 浏览 8 01-13

中国人民解放军驻澳门部队举行第十九次军营开放活动

海外网 浏览 7583 05-02

航旅纵横“赌博险”调查:9.9元押注“精准延误”,赔付率极低,专家称形似博彩游戏

华夏时报 浏览 17 08-26

今年秋冬的皮裙流行“剪一刀”,怎么搭都好看!

LinkFashion 浏览 13 10-28

皇社球员阿兰布鲁:要把绝杀进球献给经历艰难时刻的委内瑞拉

懂球帝 浏览 6 01-11

云南女子在安徽"被结婚8年":并不认识冒用其身份女子

红星新闻 浏览 6147 07-13

胡塞开始清理红海 外国船挂五星红旗“蹭保护”

掌青说历史 浏览 1865 07-10

记者:提交新报价后,米兰引进亚沙里的谈判已进入最后阶段

懂球帝 浏览 3919 07-26

刚亮完核杀器 俄罗斯"末日电台"发出6字神秘信号

参考消息网 浏览 33 11-01

美司法部已成立"打击小组" 将调查奥巴马是否"叛国"

环球网资讯 浏览 4310 07-25

疑科考队员公开出售"北极海水":全国仅100瓶 卖9999元

封面新闻 浏览 1052 08-09

李湘没想到,丑闻缠身的前夫王岳伦竟然好了起来

坊闻本尊 浏览 1942 07-09

特朗普:胡塞武装同意停止威胁中东水域安全 美将停止轰炸

环球网资讯 浏览 2478 05-07

早已挥别海航,鼎诚人寿缘何仍在饥饿线挣扎?丨正经深度

正经社 浏览 5185 07-22

500亿能源巨头独董失联,公司:原因不明

红星资本局 浏览 12 10-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2