关闭广告

让AI看懂长电影,这位准博士生想找到智能的真实边界

DeepTech深科技2025-08-11 00:00:028207人阅读

Next Gen

欢迎来到“Next Gen”。人工智能的边界每日都在被拓展,一群富有远见卓识的青年学者正站在浪潮之巅。我们追踪并报道这些 AI 领域最具潜力的明日之星,展现他们在科研前沿的突破性工作,以及对未来智能时代的独到见解。他们是谁?他们如何思考?他们又将把 AI 带向何方?与我们一同发现那些正在定义未来的 AI 新生代。

“我觉得 benchmark 要么你足够难,难到模型都没办法解决,要么你足够贴近现实生活。”

当 OpenAI 的 o4-mini-high、Google 的 Gemini 2.5 Pro 等前沿模型在困难编程题上集体拿到 0 分时,这条标准被直观地验证了。给出这组让人意外的成绩,是LiveCodeBench Pro——一个由普林斯顿大学准博士生柴文浩与团队构建的算法竞赛基准。


图丨柴文浩(来源:柴文浩)

出身数学竞赛的柴文浩,正用自己的视角重估 AI 能力的真实边界

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

WAIC 2025: 斑马智行元神AI大模型,获全球机构测评第一

雷峰网 浏览 2851 07-28

听说现在年轻人的家都“歪七扭八”的?

时尚COSMO 浏览 454 09-14

一时好奇去看了下张维伊评论区,我直接被笑的满地打滚

娱乐圈笔娱君 浏览 430 08-22

贵州省公安厅原副厅长忏悔:61岁自己把自己送进监狱

极目新闻 浏览 475 10-01

米体:尤文施压希望加快DV9转会速度,已有中间人协助米兰谈判

直播吧 浏览 5498 08-06

乌军一架F-16战斗机突发事故坠毁 细节披露

环球时报国际 浏览 1585 05-19

任上被查的北京副市长获刑12年 被指骗取博士学历

南方都市报 浏览 483 09-11

独家对话新京熹创始人段誉:餐饮未来增长,“拼”什么?

餐饮老板内参 浏览 372 10-02

印尼国脚小赖因德斯:这段旅程始于梦想,如今却以痛苦告终

懂球帝 浏览 358 10-13

牛弹琴:荷兰控制中企简直"白痴" 现在给中国道歉晚了

大象新闻 浏览 348 10-19

入秋包包合集!这12个有质感还不撞款!

Yuki女人故事 浏览 341 10-16

入秋最流行的裙子,越“大”越时髦!

LinkFashion 浏览 481 08-16

白酒困在900天库存里,胡润百强榜中仍占22席,金种子、西凤酒掉队

时代周报 浏览 311 12-24

美国一"深红"选区爆冷翻蓝 特朗普选后立即撇清关系

上观新闻 浏览 324 02-03

22省份公布2025养老金调整方案,养老金2500元,谁涨得多?

数字财经智库 浏览 1791 07-27

广东男篮内讧仍在?全队为杜锋唱生日歌,徐昕试图离开被队友拉回

风过乡 浏览 2069 07-31

女大避父!倪萍戳穿董璇半路夫妻的残酷

科学发掘 浏览 9532 08-07

都让一让,电动化时代的“超豪华”大哥来了

Report汽车 浏览 5409 07-21

视障人士携导盲犬雨夜爬泰山引争议 当事人发声

扬子晚报 浏览 519 09-21

刘锋:银行 ESG 信披的估值影响——从合规到价值创造的转型之路

首席经济学家论坛 浏览 3006 08-14

下半场7中0背锅?威少8+10+7吞三连败 美记:本有机会染指最佳PG

颜小白的篮球梦 浏览 261 12-15
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11