关闭广告

让AI看懂长电影,这位准博士生想找到智能的真实边界

DeepTech深科技2025-08-11 00:00:028206人阅读

Next Gen

欢迎来到“Next Gen”。人工智能的边界每日都在被拓展,一群富有远见卓识的青年学者正站在浪潮之巅。我们追踪并报道这些 AI 领域最具潜力的明日之星,展现他们在科研前沿的突破性工作,以及对未来智能时代的独到见解。他们是谁?他们如何思考?他们又将把 AI 带向何方?与我们一同发现那些正在定义未来的 AI 新生代。

“我觉得 benchmark 要么你足够难,难到模型都没办法解决,要么你足够贴近现实生活。”

当 OpenAI 的 o4-mini-high、Google 的 Gemini 2.5 Pro 等前沿模型在困难编程题上集体拿到 0 分时,这条标准被直观地验证了。给出这组让人意外的成绩,是LiveCodeBench Pro——一个由普林斯顿大学准博士生柴文浩与团队构建的算法竞赛基准。


图丨柴文浩(来源:柴文浩)

出身数学竞赛的柴文浩,正用自己的视角重估 AI 能力的真实边界

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

广西国资9.42亿入局,黑芝麻这回能“胡”一把?

野马财经 浏览 282 12-12

加速推进!机器人板块传出大消息!

扬子晚报 浏览 310 12-05

外媒:规模空前 大量美国军机正穿越大西洋

环球时报新闻 浏览 3562 06-17

世界最大航空发射场 拜科努尔今年70岁

环球网资讯 浏览 9093 06-30

银行新规出炉:单笔存取超5万,不再问来源或用途

密探财经 浏览 8597 08-12

史上最大规模 1.7万名青少年在渝"竞飞"无人机

上游新闻 浏览 536 08-16

笑不活了!网友集体冲进李亚鹏账号评论区,各种神评涌现太离谱!

娱乐圈笔娱君 浏览 335 10-16

美国中产正在变得危险吗?

虎嗅APP 浏览 361 10-02

罚单频现营收连降!光大银行怎么了?

天下财道社 浏览 7757 07-14

华硕灵耀14双屏2026来袭:酷睿Ultra X9加持,移动办公集大成者

IT之家 浏览 259 02-02

三架飞机在俄罗斯被扣 山河智能:收到1.6亿保险赔款

红星新闻 浏览 650 08-12

《长安的荔枝》票房高歌猛进,大鹏虽是导演,却贡献了影帝级演技

最爱酷影视 浏览 5229 07-22

NBA战报:马刺133-104大胜步行者取NBA5连胜,文班亚马17+12+1

懂球帝 浏览 390 10-18

从月销20.9万辆到4.5万辆,某车企无奈承认:已站在生死存亡边缘

小李车评李建红 浏览 506 08-15

天弘基金祁世超:军民融合加速,五大方向把握军工长期机遇

证券市场周刊 浏览 516 08-27

看到郭宇欣跑龙套旧照,站杨紫身边一点不输,才知啥叫小红靠捧

温柔娱公子 浏览 318 11-11

南京一景区内长满浮萍的水潭走红 景区:定期会清理

潇湘晨报 浏览 2221 07-15

抑郁症患者称好的“乌托邦”宝地

网易健康 浏览 9458 01-03

名记:无论小卡事件结果如何 联盟都会完善更严格的劳资协议

直播吧 浏览 420 09-21

黄色+蓝色,今年夏天最美配色!

LinkFashion 浏览 10145 06-05

华为Momenta争夺保时捷,全球大厂智驾再度“投华”

汽车公社 浏览 282 01-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11