关闭广告

让AI看懂长电影,这位准博士生想找到智能的真实边界

DeepTech深科技2025-08-11 00:00:028209人阅读

Next Gen

欢迎来到“Next Gen”。人工智能的边界每日都在被拓展,一群富有远见卓识的青年学者正站在浪潮之巅。我们追踪并报道这些 AI 领域最具潜力的明日之星,展现他们在科研前沿的突破性工作,以及对未来智能时代的独到见解。他们是谁?他们如何思考?他们又将把 AI 带向何方?与我们一同发现那些正在定义未来的 AI 新生代。

“我觉得 benchmark 要么你足够难,难到模型都没办法解决,要么你足够贴近现实生活。”

当 OpenAI 的 o4-mini-high、Google 的 Gemini 2.5 Pro 等前沿模型在困难编程题上集体拿到 0 分时,这条标准被直观地验证了。给出这组让人意外的成绩,是LiveCodeBench Pro——一个由普林斯顿大学准博士生柴文浩与团队构建的算法竞赛基准。


图丨柴文浩(来源:柴文浩)

出身数学竞赛的柴文浩,正用自己的视角重估 AI 能力的真实边界

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小泉进次郎成"下一任首相"民调第一 否认"逼宫"石破茂

澎湃新闻 浏览 555 09-10

俄堪察加地震震级修正为8.7级 可能会引发越洋海啸

财联社 浏览 5816 07-30

先L3还是直接L4?国内车企还在争论,特斯拉已经“空车”上路了

Autolab 浏览 293 12-19

索尼耳夹式LinkBuds Clip耳机曝光:4种颜色、续航37小时

IT之家 浏览 304 01-16

马卡:奥萨苏纳不会就马斯坦托诺投诉皇马,他们也干过类似的操作

直播吧 浏览 527 08-20

机器人“扎堆”上春晚,谁将成为下一个“顶流”?

雷达财经 浏览 268 01-28

18万多落地买次低配,一汽丰田亚洲龙行情导购

郝车来袭 浏览 426 09-06

特朗普说他与普京都认为以伊冲突应该结束

新华社 浏览 2439 06-15

特朗普拟终结邮寄选票

国际金融报 浏览 446 08-20

以军在加沙城行动最新画面公布

环球网资讯 浏览 398 09-18

夏天穿衣很简单,用好黑裙、白裙,加入适当的彩色,大方自然

静儿时尚达人 浏览 4302 06-20

兰克尔-泽:5-1的比分是我没想到的,下一场比赛我想赢下成都

懂球帝 浏览 4101 08-10

在都市里种下一颗自然的种子 欧拉5设计解析

网易汽车 浏览 412 09-27

售价更低 荣威i5新版本车型发动机参数下调

车质网 浏览 391 10-10

皮衣+裙子、大衣+运动鞋,这4组搭配照着穿就很时髦!

LinkFashion 浏览 247 01-29

林俊贤景区打工,如今成了这样

动物奇奇怪怪 浏览 388 10-14

福建女商人林惠荣提国赔申请获立案 曾服刑7年获无罪

澎湃新闻 浏览 284 01-20

离开组织部后,他变得客气了很多……

识局 浏览 9793 07-31

阿尔特塔:英超是欧冠决赛的预演?我不认为球员会这么想

懂球帝 浏览 110 05-09

宏和科技一季报利润大增354%!AI驱动电子布狂飙背后,300倍PE能否持续?

时代周报 浏览 160 04-22

特朗普又来威胁伊朗:若达不成协议 或有坏事发生

财联社 浏览 279 02-05
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11