关闭广告

字节跳动OmniHuman:静态照片秒变生动视频

科技行者2025-08-27 00:00:01507人阅读


音乐、说话、手势、表情——只需一张照片和一段音频,就能让静态的人物照片瞬间活起来。这听起来像是科幻电影里的情节,但现在已经成为现实。ByteDance的研究团队在2025年6月发表了一项名为"OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models"的重要研究成果,该研究由字节跳动的林高杰、姜建文、杨佳琦、郑泽荣、梁超等研究人员共同完成,已发表在arXiv平台(论文编号:arXiv:2502.01061v3),有兴趣深入了解的读者可以通过https://omnihuman-lab.github.io/访问项目详情。

这项研究解决了一个普通人都能理解的问题:如何让静态照片中的人物"动起来"。以前,制作一个人物说话或唱歌的视频需要复杂的设备和专业技术,现在只需要一张照片和想要的音频内容,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普要求日本停止进口俄罗斯能源 高市早苗当面拒绝

鲁中晨报 浏览 390 10-31

一斤豆芽28.8元,杨国福的天价麻辣烫到底卖给谁?

江瀚视野 浏览 349 11-08

中青赛:浙江U13队让二追三,两回合6-4战胜对手晋级决赛

懂球帝 浏览 474 09-01

勇士今夏首笔操作!队记Slater转会至ESPN

直播吧 浏览 948 07-17

有戏?伊萨克下家赔率:利物浦1.4遥遥领先,留队第二,沙特第三

直播吧 浏览 6326 07-25

泡泡玛特创始人王宁:本周将发售迷你版LABUBU

网易科技报道 浏览 494 08-21

鹿晗现身健身房被偶遇,高瀚宇陪同一起,网友把高瀚宇聊害羞了

扒虾侃娱 浏览 7628 08-08

从永不停机到极限巡检,大湾区机器人天团亮相WRC

南方都市报 浏览 8572 08-10

巴西28分出线,世预赛南美区改制后球队最差成绩

懂球帝 浏览 444 09-10

在福建舰弹射意味什么 详解空警-600硬核战力

极目新闻 浏览 435 09-30

乘机人姓名误填拼音致国际航班机票作废 平台回应

澎湃新闻 浏览 427 09-06

2025“能源中国—青年菁英记者计划”开营

国是直通车 浏览 523 08-20

力鸿一号未来技术成熟后,可提供亚轨道太空旅游服务

IT之家 浏览 290 01-13

马卡:让维尼修斯恢复最佳状态,已成为阿隆索的主要任务之一

懂球帝 浏览 614 08-23

汪小菲一家餐厅吃饭,看儿子玩手机表情无奈

古希腊掌管月桂的神 浏览 2749 07-27

云海肴创始人遗体告别仪式举行 好友:他患有焦虑症

鲁中晨报 浏览 502 09-21

放弃1.5亿财产低嫁的她,跟“捞男”生娃了

Yuki女人故事 浏览 9426 07-11

“空天玫瑰”炫舞长空背后:体检要忍受8个G的过载

极目新闻 浏览 407 09-23

消息称 OpenAI 正挖角苹果人才,其首批硬件产品最快2026年底亮相

IT之家 浏览 468 09-20

孝感通报西大渠成"黑水河"受干旱影响 爆料博主发声

澎湃新闻 浏览 532 09-01

胡歌、黄晓明、关晓彤齐聚,央视2026片单炸了

手工制作阿歼 浏览 323 01-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11