关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者2025-10-22 00:00:02319人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女子坚持要取走390万元现金 银行柜员无奈报警

鲁中晨报 浏览 8793 07-27

纽卡赛季前三个英超客场均0-0战平,为英超历史首次出现

直播吧 浏览 320 09-22

拆解潮玩之都东莞的流量密码

21世纪经济报道 浏览 6410 08-10

NBA独一份!加内特五项主要数据占据森林狼队史第一!

直播吧 浏览 412 09-10

大马歌姬勇闯华语乐坛:从梁静茹到戴佩妮,贵人运和实力一样好?

仙女事件簿 浏览 1097 07-14

比亚迪仰望U9新版申报

大象新闻 浏览 464 08-11

大湾区晚会太混乱!跑调抢拍忘词破音全占了,合唱几乎都翻车

萌神木木 浏览 321 09-29

泰柬冲突急转直下,世界三个没想到

牛弹琴 浏览 282 12-16

全球新能源排行榜:除了特斯拉大众,都是中国车

汽车公社 浏览 591 05-29

不尊重中国领土完整!巴萨遭批:中国特供不发外网 甩锅临时工

念洲 浏览 167 04-22

配备华为乾崑智驾ADS4 全新岚图知音将于8月底上市

网易汽车 浏览 4051 07-17

人形机器人“模特队”亮相,科技与中国传统元素结合

IT之家 浏览 2979 08-14

北京银行业绩承压?放在行业中看就明白了

BT财经 浏览 1183 07-21

每体:拉莫斯卖豪宅赚550万欧,准备投入下一个创业项目

直播吧 浏览 457 09-26

白宫黑手伸进委总统卧室!一场践踏国际规则的“黑夜绑架”

国是直通车 浏览 309 01-05

世锦赛男子200米自由泳:潘展乐总成绩第22无缘半决赛 张展硕晋级

直播吧 浏览 6230 07-28

明确容错边界,让科研人员轻装跃进

南方都市报 浏览 2912 07-15

20岁和70岁的都在买,“前8个月销量翻倍”,这种车咋又火起来了?

中新经纬 浏览 420 09-21

DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费

机器之心Pro 浏览 490 09-01

2月19日正式发布 全新奥迪RS 5预告图曝光

车质网 浏览 283 02-04

当反向过年走红 留在北京的网约车司机"狠狠捡漏"

第一财经资讯 浏览 263 02-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11