关闭广告

揭秘未来预测的终极考场:FutureX如何测试AI预言家的真本事

科技行者2025-09-10 00:00:02414人阅读


当我们问Siri今天天气如何时,它能轻松给出答案。但如果你问它明天股市会涨还是跌,或者下周的体育比赛谁会获胜,它就束手无策了。这正是人工智能面临的一个巨大挑战:如何在真实世界中进行准确的未来预测?

这项突破性研究由ByteDance Seed、复旦大学、斯坦福大学和普林斯顿大学的研究团队共同完成,于2025年9月发表在arXiv平台上(论文编号:arXiv:2508.11987v3)。感兴趣的读者可以通过https://futurex-ai.github.io/获取完整的研究资料和最新进展。

要理解这项研究的意义,不妨把当前的AI模型比作一位博学的图书馆管理员。这位管理员熟知图书馆里的每一本书,能够回答关于历史、科学、文学等各种已知知识的问题。然而,当你询问明天会发生什么事情时,这位管理员就显得力不从心了,因为图书馆里的书籍都记录的是过去的事情。

正是基于这样的观察,研究团队开发了FutureX——这是世界上第一个专门测试AI模型未来预测能力的实时评估平台。可以把FutureX想象成一个永不停歇的智力竞赛节目,每天都会出现新的预测题目,而参赛选手就是各种最先进的AI模

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美团王兴:3年狂投30家,中国具身智能最大金主

钛媒体APP 浏览 2033 07-26

国外多家航司采购中国客机意愿增大

参考消息 浏览 9094 08-03

套现15亿离场,一家三代人移居美国

壹只灰鸽子 浏览 403 09-20

预售权益价10.69万元起 东风日产N6将上市

网易汽车 浏览 266 11-15

日本首相:美国汽车在日本难以打开销路

盖世汽车 浏览 5241 07-10

普京指挥俄军战略核力量综合演习

环球网资讯 浏览 322 10-23

破旧立新,捷豹路虎和奇瑞在下一盘更大的棋

禾颜阅车 浏览 545 05-21

原来他就是白百何的二婚老公,难怪能逆风翻盘

情感大头说说 浏览 80 06-02

Linux 6.18 内核将支持高通 Adreno X1-45 GPU,适配骁龙 X1 Plus

IT之家 浏览 519 08-25

太猛了!保险巨头炒股竟大赚300多亿

财通社 浏览 310 10-20

司法部原副部长获刑13年 与3任落马部长都曾共事

上观新闻 浏览 6493 07-23

交手6次输了5次!林诗栋连追3局后葬送机会 张本智和4-3晋级决赛

风过乡 浏览 2595 07-13

博主虚构成本数据,编造“利益输送”,胖东来再发声明

大象新闻 浏览 122 05-06

无显示屏、靠Siri控场?苹果首款眼镜核心功能全曝光

环球网资讯 浏览 289 12-11

赛力斯汽车引入50亿元战略投资

盖世汽车 浏览 1472 06-26

售36.98万元 福特探险者昆仑穿越版正式上市

网易汽车 浏览 322 11-08

旺季遇冷!香飘飘冲泡业务颓势难逆,上半年营收不振、预亏近亿元

经理人杂志 浏览 6589 07-25

记者:7月31日北美联杯揭幕战,德保罗有望迎来迈阿密国际首秀

直播吧 浏览 3268 07-17

涉债权1600亿,中信信托“啃”下金科重整服务信托资产包

密探财经 浏览 398 09-29

E句话| 这对邪门CP又是哪里来的?

仙女事件簿 浏览 246 11-01

新势力首家,小鹏汽车宣布将支付账期统一至60天内

盖世汽车 浏览 525 06-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11