关闭广告

腾讯突破:AI实现对话到电影的完整自动化制作

科技行者2026-01-28 00:00:01188人阅读


当你看到一部电影时,是否想过从剧本到银幕需要经历多少复杂的工作?导演需要将文字转换为视觉画面,摄影师要选择合适的镜头角度,演员要演绎角色情感,剪辑师要确保画面流畅连贯。现在,腾讯混元多模态团队与西安电子科技大学合作的最新研究,首次实现了从对话到完整电影的全自动化制作流程。这项研究于2026年1月发表在计算机视觉顶级会议上,论文编号为arXiv:2601.17737v1,有兴趣深入了解的读者可以通过该编号查询完整论文。

研究团队面临的挑战就像是要教会一台机器如何理解人类的创意思维。当我们说"他疲惫地爬上山顶,终于找到了那支笔"这样简单的对话时,人类导演能够立即想象出具体的场景:角色的表情、山顶的环境、镜头的运动轨迹,甚至是光线的变化。但对于AI来说,这种从抽象语言到具体视觉的转换过程就像是让一个从未见过颜色的人去画一幅彩色画作一样困难。

传统的视频生成技术就像是一个只会照着菜谱做菜的厨师,你必须给它详细的步骤说明才能得到想要的结果。而腾讯团队要解决的问题更像是让这个厨师仅仅听到"我想吃一顿温馨的家常晚餐"就能自动设计菜谱、采购食材、烹饪并摆盘。这种从高层概念到具体执行的巨大跨越,正是电影制作自动化面临的

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

!被骂“恋爱脑”的董璇玩脱了?

查尔菲的笔记 浏览 341 09-06

多国承认巴勒斯坦国 以色列称战争目标"不仅限于加沙"

国际在线 浏览 354 09-24

金价持续调整,投资者该入局吗?

国际金融报 浏览 2312 07-13

艾纳维:我没想离开朗斯,但效力罗马这种俱乐部是每个孩子的梦想

直播吧 浏览 1882 07-29

CHERRY 樱桃推出三款四型 KW 系列机械键盘,面向现代办公场景

IT之家 浏览 3331 08-06

超越纯视觉模型!不改VLM标准架构,实现像素级深度预测

新智元 浏览 280 10-20

上市就官降3万 新款锋兰达变智能了 双擎和燃油版如何选?

蜗牛车志V 浏览 345 09-30

图片报:多特改造厨房花费1100万欧,类似原因使今夏转会预算有限

直播吧 浏览 1278 08-06

12岁女生登上山东舰:原来航母跟座小岛一样大

看看新闻Knews 浏览 10400 07-07

AI抢产能、车厂抢内存,这场博弈中国车企如何破局?

百姓评车 浏览 174 02-04

光伏企业3季报里的秘密:反内卷之下,行业真的触底反弹了吗?

赶碳号 浏览 232 11-03

一家三口被撞身亡案将宣判 家属悔恨当天喊他们来吃饭

极目新闻 浏览 165 01-09

特朗普称"无需担心"美印关系 莫迪回应了

看看新闻Knews 浏览 436 09-07

26款奇瑞冰淇淋/小蚂蚁上市 报废双补价3.4万元起

网易汽车 浏览 199 01-11

“出轨门”过去11年,文章马伊琍也迎来各自结局

可乐谈情感 浏览 4671 08-14

微成都周报|可控核聚变“国家队”来了,四川聚变拟斥资4.51亿参股;京东拿下四川生活家控股权;中免市内免税品(成都)有限公司成立

红星资本局 浏览 6433 07-27

西安街头邂逅赵露思,美到让人不敢认

手工制作阿歼 浏览 316 09-22

00后辍学生打造“作弊神器”,被停学却获千万投资

虎嗅APP 浏览 301 10-01

男子杀女友后潜逃25年:没睡过整觉 梦里全是血和锤子

扬子晚报 浏览 565 08-23

接到立案通知后,股民以为完了,5个月后一算账,7000人账面翻倍

壹只灰鸽子 浏览 178 12-12

金山办公放不下协同梦

光子星球 浏览 466 08-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11