关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者2025-10-22 00:00:02325人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国新能源汽车出海遭遇“专利围剿”

电动汽车观察家 浏览 479 08-27

以方被指要求美加入针对伊朗的军事行动 美国尚未考虑

环球网资讯 浏览 3059 06-15

农村男孩高考689分进入清华大学:我就是"小镇做题家"

澎湃新闻 浏览 2492 08-24

Lazada和天猫把系统打通了

华尔街见闻官方 浏览 420 09-26

12岁男孩烫伤后死亡:死前还在干活 父母均智力残疾

新京报 浏览 269 01-15

美国ITC正式对可穿戴脑电图设备及其系统及其组件启动337调查

商务部网站 浏览 1012 08-07

定了!国乒12人出战横滨冠军赛,王楚钦孙颖莎领军,林高远未参赛

乒谈 浏览 6895 07-30

世界最大航空发射场 拜科努尔今年70岁

环球网资讯 浏览 9099 06-30

国内首款单曝光压缩光谱成像技术高光谱成像相机研发成功

IT之家 浏览 8390 07-31

球报:雷纳托-桑切斯即将租借加盟帕纳辛奈科斯

懂球帝 浏览 526 08-20

冰玉白新色/可免费选装 极氪009光辉售78.90万元起

网易汽车 浏览 8599 08-06

塞梅尼奥立竿见影,曼城10球隔山敲打阿森纳

体坛周报 浏览 285 01-12

泰国机场集团成泰国旅游产业“危机”警示灯

观察者网 浏览 8873 06-21

媒体:放弃全球霸权 背叛美国的美国已不再自信

南风窗 浏览 316 12-11

26岁券商分析师转行 自称"上海链家最高学历拥有者"

中国基金报 浏览 599 08-25

狩猎者连开数枪枪击老太:2次逃离后充当"好心人"送医

环球网资讯 浏览 568 08-19

AI广告大爆发!AI能生成广告,广告在影响AI,用户惨了

雷科技 浏览 4357 07-18

人口连跌三年后,国家发钱生孩子了!

米筐投资 浏览 9180 07-30

上海15岁女生军训身亡 母亲:我不理解 她身体一直很好

极目新闻 浏览 563 08-25

“AIGC从工具到生态的破局之路”

观察者网 浏览 534 08-12

中方取消多场重要会议 李在明承诺:帮高市"搞定"中国

现代小青青慕慕 浏览 353 11-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11