关闭广告

字节跳动OmniHuman:静态照片秒变生动视频

科技行者2025-08-27 00:00:01241人阅读


音乐、说话、手势、表情——只需一张照片和一段音频,就能让静态的人物照片瞬间活起来。这听起来像是科幻电影里的情节,但现在已经成为现实。ByteDance的研究团队在2025年6月发表了一项名为"OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models"的重要研究成果,该研究由字节跳动的林高杰、姜建文、杨佳琦、郑泽荣、梁超等研究人员共同完成,已发表在arXiv平台(论文编号:arXiv:2502.01061v3),有兴趣深入了解的读者可以通过https://omnihuman-lab.github.io/访问项目详情。

这项研究解决了一个普通人都能理解的问题:如何让静态照片中的人物"动起来"。以前,制作一个人物说话或唱歌的视频需要复杂的设备和专业技术,现在只需要一张照片和想要的音频内容,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特斯拉新车Model Y L官宣,预计售价约40万元

中国基金报 浏览 3905 07-17

江淮钇为3与吉利银河星愿谁更能吸引年轻人?

汽车经纬网 浏览 262 05-10

雷军回应小米召回SU7

澎湃新闻 浏览 181 09-21

封面科技参编 新闻行业大规模预训练模型系列团体标准正式上线

封面新闻 浏览 211 08-20

华为提出行业智能化“ACT三步走”实施路径,并发布9大行业智能化解决方案

上观新闻 浏览 161 09-20

试过了,“和SIM卡并无差异”

都市快报橙柿互动 浏览 82 10-23

50+女人听我一句劝,别穿大红大紫和超短裙,才能优雅到老

静儿时尚达人 浏览 78 10-28

德约选出心中的温网冠军,预测会和法网决赛一样火星四射

网球之家 浏览 6398 07-13

vivo Vision 探索版混合现实头显预热视频公布,今年不会公开销售

IT之家 浏览 7690 08-13

张靓颖的眼镜,戴和摘都是错

时尚COSMO 浏览 4945 07-18

女子与15名泰高僧上床 拍下8万张照片及5600段视频

胡侃社会百态 浏览 3194 07-16

马斯克宣布xAI Grok 2下周开源

IT之家 浏览 9444 08-07

每体:巴萨将在甘伯杯后决定是否继续让特尔施特根担任队长

懂球帝 浏览 1006 07-27

8年等一次,破价大促,这些漂亮裙子衣服正是入手的好时机

黎贝卡的异想世界 浏览 480 08-09

订单突破5万台/售12.98万起 长安启源Q07开启交付

网易汽车 浏览 290 05-22

《南京照相馆》上映5天,幸福蓝海股价暴涨7成

斑马消费 浏览 3328 07-30

"佛门CEO"释永信被查 进入少林寺时一片破败香火不旺

第一财经资讯 浏览 3084 07-28

龚琳娜:万物都在歌里

时尚COSMO 浏览 182 09-11

腿粗女孩的王炸显瘦技巧,它来了~

Yuki女人故事 浏览 167 09-19

长城汽车10月销售新车14.31万辆 同比增长22.5%

网易汽车 浏览 60 11-03

董璇首谈高云翔事件,佟丽娅帮了大忙

小杨侃事 浏览 3555 07-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11