关闭广告

让AI看懂长电影,这位准博士生想找到智能的真实边界

DeepTech深科技2025-08-11 00:00:028130人阅读

Next Gen

欢迎来到“Next Gen”。人工智能的边界每日都在被拓展,一群富有远见卓识的青年学者正站在浪潮之巅。我们追踪并报道这些 AI 领域最具潜力的明日之星,展现他们在科研前沿的突破性工作,以及对未来智能时代的独到见解。他们是谁?他们如何思考?他们又将把 AI 带向何方?与我们一同发现那些正在定义未来的 AI 新生代。

“我觉得 benchmark 要么你足够难,难到模型都没办法解决,要么你足够贴近现实生活。”

当 OpenAI 的 o4-mini-high、Google 的 Gemini 2.5 Pro 等前沿模型在困难编程题上集体拿到 0 分时,这条标准被直观地验证了。给出这组让人意外的成绩,是LiveCodeBench Pro——一个由普林斯顿大学准博士生柴文浩与团队构建的算法竞赛基准。


图丨柴文浩(来源:柴文浩)

出身数学竞赛的柴文浩,正用自己的视角重估 AI 能力的真实边界

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

开始重拳抓人了!首富女明星内幕交易,女星亏完500万被抓了

大猫财经Pro 浏览 321 09-11

墙倒众人推,吴京风波扯上多位明星?

陈意小可爱 浏览 388 09-01

美专家:亚洲国家被课税40% 谁搭理鲁比奥那套中国说辞

澎湃新闻 浏览 3254 07-11

芒格的「痛苦药方」治好了我

简七理财 浏览 7825 08-11

今日热点:王鹤润方向王玉雯道歉;正午阳光辟谣《琅琊榜3》阵容信息……

伊周潮流 浏览 118 03-14

众泰还魂?追觅新车实车照曝光:一比一复刻宾利添越

三言科技 浏览 207 10-18

前10月规模以上高技术制造业利润同比增长8.0%

北京商报 浏览 194 11-27

企业员工外派半月后轻生:家属质疑工作压力大企业否认

澎湃新闻 浏览 570 08-11

新片票房不及预期,大鹏开始了反思!

电和影 浏览 6934 08-09

李月汝20+4大爆发创WNBA生涯纪录 终结连9场未上双飞翼1分险胜

醉卧浮生 浏览 4868 08-13

何超莲秀恩爱,晒与窦骁看表演吃日料视频

笑一个吧 浏览 103 03-17

安踏还要继续追赶耐克|氪金·大消费

36氪财经 浏览 357 09-02

巴媒:巴西将在10月国际比赛日分别对阵日本与韩国

懂球帝 浏览 3941 08-12

北美夺冠,成本超3.5亿,刚打败《浪浪山》的成龙又迎来了对手

靠谱电影君 浏览 452 08-21

于正谈杨幂真翻身了

大龄女一晓彤 浏览 503 08-22

日本拟引进乌无人机 其防卫预算首次突破9万亿日元

扬子晚报 浏览 155 03-17

中国豪华车老大之争:奥迪凭啥干掉奔驰宝马?

天天汽车 浏览 167 01-29

湖南多个火车站站台15元盒饭火出圈 网友:全国天花板

潇湘晨报 浏览 541 08-14

女明星恋爱结婚愈发不看脸!太多女强男弱,男方槽点一个比一个多

萌神木木 浏览 2128 07-17

蛇咬、虫蜇……如何应对常见动物伤害?

人民日报海外版 浏览 5829 06-07

30亿资本注入,破产重整的上汽红岩如何“翻身”?

汽扯扒谈 浏览 246 10-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11