关闭广告

让AI看懂长电影,这位准博士生想找到智能的真实边界

DeepTech深科技2025-08-11 00:00:027954人阅读

Next Gen

欢迎来到“Next Gen”。人工智能的边界每日都在被拓展,一群富有远见卓识的青年学者正站在浪潮之巅。我们追踪并报道这些 AI 领域最具潜力的明日之星,展现他们在科研前沿的突破性工作,以及对未来智能时代的独到见解。他们是谁?他们如何思考?他们又将把 AI 带向何方?与我们一同发现那些正在定义未来的 AI 新生代。

“我觉得 benchmark 要么你足够难,难到模型都没办法解决,要么你足够贴近现实生活。”

当 OpenAI 的 o4-mini-high、Google 的 Gemini 2.5 Pro 等前沿模型在困难编程题上集体拿到 0 分时,这条标准被直观地验证了。给出这组让人意外的成绩,是LiveCodeBench Pro——一个由普林斯顿大学准博士生柴文浩与团队构建的算法竞赛基准。


图丨柴文浩(来源:柴文浩)

出身数学竞赛的柴文浩,正用自己的视角重估 AI 能力的真实边界

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

4400亿!中证A500指数基金一周年:总规模增近50%,近80家基金公司下场

券商中国 浏览 161 09-22

全员社保:被看见的与被忽视的

雪豹财经社 浏览 319 08-12

全新奥迪Q3官图,外观更年轻,内饰科幻,换代成功了?

优视汽车 浏览 10035 06-23

头部基金,争相申报巴西主题QDII!

券商中国 浏览 102 10-16

4nm芯片+1301km续航 马自达EZ-60亮相大湾区车展

Nice好车 浏览 273 05-29

定位大型SUV 腾势N8L无伪装实车图曝光

车质网 浏览 1707 07-14

突发!超10万人爆仓,发生了什么?

券商中国 浏览 4335 08-10

辛纳0-5落后退赛太意外,阿卡戏剧性夺冠后金大师伟业只差三站

网球之家 浏览 273 08-19

前球员:詹姆斯太自恋了必须一直被关注 从不在输球时承担责任

直播吧 浏览 175 09-21

中国留学生潜水后失踪妻子4天后报警 仅找到一根胫骨

新民晚报 浏览 166 10-09

程强:三季度成长板块领涨市场

首席经济学家论坛 浏览 130 10-02

宁家服务直营体验中心落地上海 宁德时代打造新能源后市场标杆

上观新闻 浏览 2502 08-11

前员工偷拍6岁女孩照片用作背景图 西贝发布致歉声明

澎湃新闻 浏览 1079 06-28

原来他们是夫妻,演完《生万物》终于红了

星说影视时光 浏览 257 08-16

中外科学家汇聚北京共话“基础科学”

新华社 浏览 3695 07-14

危险信号!人类,要戳破AI的泡沫了

米筐投资 浏览 4991 08-13

官方:上海海港签下中国香港边后卫亚历斯祖

懂球帝 浏览 1437 07-18

今年秋天的卫衣,放松穿最好看!

LinkFashion 浏览 139 09-29

对话一线保险人|新职业养老服务师:补位“保险+养老”生态核心拼图

蓝鲸Insurance 浏览 280 08-14

墨西哥拟提高对华商品关税,涵盖汽车、纺织品和塑料等产品

国际金融报 浏览 204 09-01

沙特AI公司首批数据中心破土动工,计划明年初投入运营,从美国进口芯片

华尔街见闻官方 浏览 288 08-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11