关闭广告

牛津VGG团队突破:单一网络实现视频动态3D重建

科技行者2026-01-20 00:00:01285人阅读


这项由牛津大学视觉几何组(VGG)团队开展的研究发表于2025年1月,论文编号为arXiv:2601.09499v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下,当你在看一段视频时,你的大脑能够同时理解画面中物体的三维形状、它们的运动轨迹,以及摄像机的移动。现在,牛津大学的研究人员成功让计算机也具备了这种"立体视觉"能力。他们开发的V-DPM系统能够从一段普通视频中同时重建出场景的3D结构、物体的运动轨迹,甚至摄像机的参数——这就像给机器装上了一双能够"看透"视频背后三维世界的眼睛。

这项技术的突破性在于,它是首个能够在单次处理中完成所有这些任务的系统。以往的方法要么只能处理静态场景,要么需要多个步骤才能分别处理形状和运动。而V-DPM就像一位全能的"视频分析师",能够一眼看出视频中的所有三维信息。更令人惊叹的是,研究团队巧妙地利用了在静态场景上训练的现有模型VGGT,通过相对少量的动态数据微调,就让它学会了处理复杂的动态场景——这就像让一位擅长画静物的画家,通过少量练习就学会了画动态人像。

这项研究解决了计算机视觉领域一个长期存在的挑战:如何让机器同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

当你的代码测试出问题时,人工智能能像专业程序员一样修复吗?

科技行者 浏览 274 02-04

这个“圆球”,曾点亮中国激光技术之路

北青网-北京青年报 浏览 491 08-24

冲着唐嫣去看《爱情没有神话》,却被演反派的冯绍峰吸引了

温柔娱公子 浏览 355 10-18

苹果发完M5芯片,最开心的是M1钉子户

机器之心Pro 浏览 350 10-16

别再揪着不放!孙杨张豆豆就和麦琳李行亮一样,一个愿打一个愿挨

娱乐圈笔娱君 浏览 111 05-09

东方甄选人事地震:俞敏洪的意志,新高管的刀

每日人物 浏览 129 05-06

事关钓鱼岛、南海等问题 国防部最新回应

环球网资讯 浏览 269 01-08

生于中国的美国研究员承认窃取美国商业机密 中方回应

外交部网站 浏览 6267 07-23

美媒评新赛季小前锋TOP26:詹杜前2 小瓦第3 小卡第5 巴特勒第8

直播吧 浏览 456 08-20

小米汽车磁吸物理按键已接入米家,还可以放在家里使用

环球网资讯 浏览 7812 08-06

真爱大牌返场|| 一上线就被抢空的牌子,这次居然100+就能拥有

黎贝卡的异想世界 浏览 299 11-06

俄方:美英决定"推举"前乌军总司令扎卢日内为乌总统

环球网资讯 浏览 7562 07-30

白宫:特朗普愿同金正恩不设前提条件对话

参考消息 浏览 539 10-02

就算大雨全都落下,也不能忘记时髦出发

时尚COSMO 浏览 1825 07-31

日本多地严重缺水 水稻产区面临“新米危机”

浏览 155713 09-26

加拿大航空暂停原定复航计划 航班推迟至18日晚恢复

环球网资讯 浏览 539 08-18

"中原粮仓"经历罕见干旱 农民:贷款种地利息都还不上

新京报 浏览 10562 08-07

小米汽车:小米YU7率先支持Wi-Fi 7上车

三言科技 浏览 6302 08-06

"嘎子哥"穿警服直播带货被举报 警方通报:拘留7日

现代快报 浏览 516 09-18

乌克兰决定与尼加拉瓜断交

参考消息 浏览 246 10-04

一架轻型飞机在波兰坠毁 造成两人死亡

上观新闻 浏览 531 08-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11