关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者2025-10-31 00:00:02351人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

金童玉女离婚20年,怎么不算圆满大结局呢?

Yuki女人故事 浏览 9608 07-27

腾讯想做机器人的“大脑”供应商,现阶段不追求商业化

南方都市报 浏览 2406 07-29

关晓彤新剧番位争议炸锅!李昀锐粉丝为何集体破防?

Yuki女人故事 浏览 4413 06-14

61岁影后张曼玉回港低调看演唱会,化身迷妹

娱乐留声机彡 浏览 270 02-04

美日菲澳齐聚夏威夷,中国破“印太北约”棋局

浏览 6473 07-14

解放军组织轰炸机编队位南海例行巡航

界面新闻 浏览 273 11-17

华住20年,治好了我的“订酒店焦虑”

惊蛰研究所 浏览 3820 07-18

江一燕官宣离婚后首发声

扒虾侃娱 浏览 354 10-31

E句话| 这对邪门CP又是哪里来的?

仙女事件簿 浏览 242 11-01

印度稀土转卖丑闻曝光,伪造文件骗取稀土转卖老美

大国观察眼 浏览 258 02-02

进口头孢西力欣涨价30倍!国内已停供2年,医生称非理性囤货没必要

红星资本局 浏览 314 01-07

八位堂推出“任天堂 NES 游戏机 40 周年”主体限定外设硬件

IT之家 浏览 383 10-19

今年两院院士增选候选人名单有哪些看点?“85后”亮相,尖端领域群星闪耀

澎湃新闻 浏览 565 08-22

于正前脚内涵任嘉伦,央视后脚出来打脸!

科学发掘 浏览 3930 07-08

李成钢:中美双方将继续推动美方已暂停的对等关税24%部分以及中方反制措施如期展期

证券时报e公司 浏览 3940 07-30

消失的1.8%,你的钱会发生什么

米筐投资 浏览 216 03-17

自闭症男童已失联超48小时 涉事的夏令营公众号被注销

上游新闻 浏览 657 08-12

拼了,TA:雄鹿计划用现有资源进行重磅引援来挽回字母哥

懂球帝 浏览 300 12-16

遭指控侵犯专利 "非洲之王"传音控股又被华为告了

每日经济新闻 浏览 8657 08-07

紫光展锐发布端边AI芯片平台N9系列:4nm工艺,Arm v9.2 CPU

IT之家 浏览 117 05-09

牌面!贵州村超将于7月26日重启赛事,巴乔、卡洛斯将现身揭幕战

直播吧 浏览 5041 07-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11