关闭广告

牛津VGG团队突破:单一网络实现视频动态3D重建

科技行者2026-01-20 00:00:01183人阅读


这项由牛津大学视觉几何组(VGG)团队开展的研究发表于2025年1月,论文编号为arXiv:2601.09499v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下,当你在看一段视频时,你的大脑能够同时理解画面中物体的三维形状、它们的运动轨迹,以及摄像机的移动。现在,牛津大学的研究人员成功让计算机也具备了这种"立体视觉"能力。他们开发的V-DPM系统能够从一段普通视频中同时重建出场景的3D结构、物体的运动轨迹,甚至摄像机的参数——这就像给机器装上了一双能够"看透"视频背后三维世界的眼睛。

这项技术的突破性在于,它是首个能够在单次处理中完成所有这些任务的系统。以往的方法要么只能处理静态场景,要么需要多个步骤才能分别处理形状和运动。而V-DPM就像一位全能的"视频分析师",能够一眼看出视频中的所有三维信息。更令人惊叹的是,研究团队巧妙地利用了在静态场景上训练的现有模型VGGT,通过相对少量的动态数据微调,就让它学会了处理复杂的动态场景——这就像让一位擅长画静物的画家,通过少量练习就学会了画动态人像。

这项研究解决了计算机视觉领域一个长期存在的挑战:如何让机器同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

西甲:皇家贝蒂斯2比0奥萨苏纳

体坛周报 浏览 275 09-29

李羲承退出ENHYPEN,组合未来将以六人形式活动

精彩背后的故事 浏览 123 03-11

扎克伯格详解"个人超级智能",底气是百亿利润

网易科技报道 浏览 2190 07-31

小米SU7最低配的算力才84,车主真的够用吗?

车有梗 浏览 9888 07-26

“70后”卢东亮当选山西省省长

澎湃新闻 浏览 9199 06-17

美总统要"派兵"到芝加哥维持治安 当地市长:深感忧虑

红星新闻 浏览 529 08-25

妇联回应受胡雷资助女孩去世:村镇妇联一直进行帮扶

极目新闻 浏览 482 08-23

黄奕女儿被网友抵制出道,黄奕:喜欢而已没出道

情感大头说说 浏览 9822 08-06

长期的“台积电第一大客户”,苹果如今也不得不“抢产能”了

华尔街见闻官方 浏览 213 01-16

国内首个海上可复用火箭基地开工 发射成本对标SpaceX

澎湃新闻 浏览 187 01-09

红场阅兵结束后 普京与多位朝鲜将军握手拥抱

北京日报 浏览 7253 05-10

王晶曝张柏芝身体不好,生理期疼到住院,称她是香港最后玉女演员

扒虾侃娱 浏览 323 09-26

标配倍适登EDC减震器 岚图FREE+底盘信息曝光

网易汽车 浏览 436 06-14

看了被“烤瓷大白牙”毁了的年代剧,我怀念起了刘琳巩俐的乡土味

娱乐圈笔娱君 浏览 185 01-16

泸州老窖,迎来十年拐点,可惜是向下拐

穿透公司 浏览 437 09-02

国庆档第一刷,值了,这四年没白等

独立鱼 浏览 292 10-02

男童与亲爸后妈自驾1千公里坐后备箱 父亲:我对他很好

上观新闻 浏览 4293 07-18

“装了周杰伦”的机器狗?巨星传奇把6000台卖给了谁?

野马财经 浏览 221 11-11

美联储理事沃勒:可以考虑7月降息,支持继续缩表,增加短期资产比重

华尔街见闻官方 浏览 8638 07-11

英伟达向CoreWeave追加投资20亿美元,首推独立CPU芯片

华尔街见闻官方 浏览 165 01-27

曝卡塞米罗续约曼联条款,一条件可保35万周薪!卖齐尔克泽恐已定

罗米的曼联博客 浏览 192 01-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11