关闭广告

揭秘未来预测的终极考场:FutureX如何测试AI预言家的真本事

科技行者2025-09-10 00:00:02169人阅读


当我们问Siri今天天气如何时,它能轻松给出答案。但如果你问它明天股市会涨还是跌,或者下周的体育比赛谁会获胜,它就束手无策了。这正是人工智能面临的一个巨大挑战:如何在真实世界中进行准确的未来预测?

这项突破性研究由ByteDance Seed、复旦大学、斯坦福大学和普林斯顿大学的研究团队共同完成,于2025年9月发表在arXiv平台上(论文编号:arXiv:2508.11987v3)。感兴趣的读者可以通过https://futurex-ai.github.io/获取完整的研究资料和最新进展。

要理解这项研究的意义,不妨把当前的AI模型比作一位博学的图书馆管理员。这位管理员熟知图书馆里的每一本书,能够回答关于历史、科学、文学等各种已知知识的问题。然而,当你询问明天会发生什么事情时,这位管理员就显得力不从心了,因为图书馆里的书籍都记录的是过去的事情。

正是基于这样的观察,研究团队开发了FutureX——这是世界上第一个专门测试AI模型未来预测能力的实时评估平台。可以把FutureX想象成一个永不停歇的智力竞赛节目,每天都会出现新的预测题目,而参赛选手就是各种最先进的AI模

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杨兰兰身份疑被扒 知情人:名字能猜出身份 叠字有讲究

火山诗话 浏览 4220 08-10

蔡浩宇的疯狂实验,跟游戏没啥关系?

字母榜 浏览 233 08-24

特朗普:每年花费数十亿美元保护和支持以色列

鲁中晨报 浏览 914 06-30

巴黎塞纳河中同时发现4具高度腐烂男尸 死因成谜

红星新闻 浏览 263 08-16

被Meta点醒,苹果砍掉廉价头显,押注智能眼镜

网易科技报道 浏览 124 10-13

国产纯电SUV三代,全新蔚来ES8要来了

懂车之道 浏览 259 08-15

黄仁勋:任何低估华为、低估中国制造能力的人都极其天真

第一财经资讯 浏览 1121 07-17

奔驰GLC纯电版国内谍照曝光 将于9月首发

车质网 浏览 6566 08-13

对话Genspark、Lovart、Simular.AI创始人:OpenAI入场是大利好,ARR绝非唯一重要的事|硅谷活动

硅星人 浏览 5946 07-27

迷你主机厂商 GEEKOM 积核进军笔记本市场,带来两款轻薄本

IT之家 浏览 199 09-08

航空公司"杀熟"背后;抄袭与创作的区别正在消失

澎湃新闻 浏览 10178 08-13

险企竞逐居家养老生态:打通“资金-服务”价值循环链,覆盖“医护住娱”等多维场景

蓝鲸Insurance 浏览 2544 07-17

巴奴火锅要上市了 创始人曾称"月薪5000不要吃"惹争议

中国新闻周刊 浏览 4672 07-10

黄仁勋:轻视华为和中国制造的人非常天真

网易科技报道 浏览 1496 07-17

普京透露核潜艇建造计划:拟再补充4艘"北风之神-A"级

鲁中晨报 浏览 7572 07-26

刘宇宁表示自己会患得患失,三天没工作会开直播

芊手若 浏览 8108 07-11

10月第一周豪华SUV销量榜 奥迪Q5L第2/宝马X3第5

小李子体育 浏览 43 11-09

全球首个太空AI诞生,H100在轨炼出!马斯克爆赞

新智元 浏览 8 12-11

上海首批!小马智行获准于中心城区开展示范运营

财经众议院 浏览 6012 07-27

赛季首胜!切尔西5-1大胜西汉姆联 佩德罗1射2传恩佐&凯塞多建功

直播吧 浏览 221 08-23

即将加盟洛杉矶FC!孙兴慜启程前往美国,他在机场为粉丝签名

直播吧 浏览 1991 08-06
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11