关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者2026-01-20 00:00:01280人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

181亿医疗信息化龙头掌舵人周炜,行贿一审被判后辞去董事长

雷达财经 浏览 316 11-10

斯洛特:尽管我们取得四连胜,但球队的表现并不完美

懂球帝 浏览 276 01-02

全球仅2家!广东1.85万亿产业托底,杀出美股+港股双上市智驾巨头

21世纪经济报道 浏览 285 01-18

PEEK材料概念大涨,中欣氟材收获5天4板

览富财经网 浏览 10331 08-12

冬季穿衣别太过于单薄,看看这些大衣和羽绒服,保暖简约百搭

静儿时尚达人 浏览 271 12-09

韩国知名潮牌宣布将关闭中国全部门店 陆续打折清仓

潇湘晨报 浏览 288 11-04

高市内阁名单出炉 身材火辣的日本知名写真女星入选

红星新闻 浏览 345 10-25

美财长公然挑拨中阿关系:米莱承诺"让中国退出阿根廷"

环球网资讯 浏览 364 10-13

贵阳街头一只猴子在高空走电线 网友调侃“猴子成精”

极目新闻 浏览 7389 07-25

刘畅闺蜜、得到创始人“脱不花”被提名为新希望独董候选人,刘永好曾说她“能说会道”

红星资本局 浏览 5050 07-18

商用场景低耗优于竞品,AMD 锐龙 7 8700G 处理器评测

IT之家 浏览 8828 07-31

抢不到票、退不了款,演唱会的锅该不该大麦背?

定焦One 浏览 575 08-20

毕巴官方:后卫阿罗约顺利完成右膝关节手术,此前十字韧带断裂

直播吧 浏览 5417 08-07

晚上8点,官宣!樊振东当上老板,投资方式曝光,足迹遍布亚欧美

侃球熊弟 浏览 1948 08-07

新增激光雷达 2026款比亚迪夏官图发布

车质网 浏览 252 10-31

联大反击或剥夺美国重要资格 美恐难再与中同台论道

策略述 浏览 317 01-11

于正称不再联系少女七七,妈妈的极速变现踩雷

大龄女一晓彤 浏览 4122 07-23

男子假冒多个"联合国外交官"身份 还穿假军装公开亮相

澎湃新闻 浏览 607 08-26

富豪阮鸿献给爱女发过亿大红包,已连续三年未登上胡润百富榜

雷达财经 浏览 298 11-10

A股“高端零食第一股”良品铺子停牌!控制权或生变

国际金融报 浏览 9206 07-12

委内瑞拉外长称已接待美驻委临时代办

国际在线 浏览 257 02-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11