关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者2025-10-22 00:00:0297人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

为什么慢慢跑,也能赢?

虎嗅APP 浏览 4362 07-16

记者:巴萨接近与弗朗基-德容续约

懂球帝 浏览 5033 07-29

Here we go!罗马诺:拜仁将签下利物浦前锋迪亚斯,转会费7500万欧

懂球帝 浏览 6368 07-28

美联储降息25基点 仍预计明年降息一次

华尔街见闻官方 浏览 5 12-11

特朗普:将考虑因铀浓缩问题再次轰炸伊朗

环球网资讯 浏览 4103 06-28

6月大男婴医院离世 家长获赔88万:我的律师拿走55万

大风新闻 浏览 3401 07-17

金鸡奖提名惹争议!马丽落选段奥娟入围,刘昊然易烊千玺争影帝

萌神木木 浏览 161 09-26

媒体:"普特会"时长比预期缩短 释放多重信号信息量大

环球时报新闻 浏览 241 08-17

小红书线下市集太好逛了!不止买卖还社交,这就是生活电商

雷科技 浏览 234 09-01

俄方:普京即将开启的访华之旅"史无前例"

参考消息 浏览 242 08-29

苹果“抗争”无果,欧盟委员会力挺《数字市场法案》

环球网资讯 浏览 154 09-26

巴基斯坦夜袭阿富汗边境地区 打死至少70名武装人员

新华社 浏览 108 10-19

动力升级 新款保时捷911 4S系列官图发布

车质网 浏览 10034 07-03

巴菲特:目前没计划收购其他铁路公司,确实与CSX讨论了加强合作

华尔街见闻官方 浏览 252 08-26

张译李光洁喝酒聚餐,两人吃小馆被赞朴素接地气

喵姐爱娱乐8 浏览 4337 08-04

5年、21亿美元,百度史上最大收购案图什么?YY直播CEO李乐:1000多名员工并入百度

时代周报 浏览 191 09-10

牛弹琴:越南或在最后一刻遭特朗普暗算 十分失望愤怒

上观新闻 浏览 1415 07-12

世锦赛4×400接力:中国队3分00秒77破全国纪录,排名第13无缘晋级

全景体育V 浏览 182 09-21

别克“正本清源” “真龙”增程助力合资回技术C位?

经济观察报 浏览 2579 08-13

地狱笑话的背后,是新女性生存样本

时尚COSMO 浏览 4604 07-17

车主称50升油箱被加了67.96升汽油 涉事加油站未回应

澎湃新闻 浏览 757 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11