关闭广告

让AI看懂长电影,这位准博士生想找到智能的真实边界

DeepTech深科技2025-08-11 00:00:028123人阅读

Next Gen

欢迎来到“Next Gen”。人工智能的边界每日都在被拓展,一群富有远见卓识的青年学者正站在浪潮之巅。我们追踪并报道这些 AI 领域最具潜力的明日之星,展现他们在科研前沿的突破性工作,以及对未来智能时代的独到见解。他们是谁?他们如何思考?他们又将把 AI 带向何方?与我们一同发现那些正在定义未来的 AI 新生代。

“我觉得 benchmark 要么你足够难,难到模型都没办法解决,要么你足够贴近现实生活。”

当 OpenAI 的 o4-mini-high、Google 的 Gemini 2.5 Pro 等前沿模型在困难编程题上集体拿到 0 分时,这条标准被直观地验证了。给出这组让人意外的成绩,是LiveCodeBench Pro——一个由普林斯顿大学准博士生柴文浩与团队构建的算法竞赛基准。


图丨柴文浩(来源:柴文浩)

出身数学竞赛的柴文浩,正用自己的视角重估 AI 能力的真实边界

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以无人机黎巴嫩南部炸死真主党要员 爆炸瞬间腾起浓烟

新京报 浏览 250 10-08

意媒:尤文将与国米、米兰竞争莱昂尼,近期已接触球员经纪人

懂球帝 浏览 5432 07-21

打平出线!中国队嗨翻了,更衣室疯狂庆祝如夺冠,对手颠球不想踢

侃球熊弟 浏览 377 09-10

王楚钦4-3战胜F-勒布伦,率先晋级WTT美国大满贯男单决赛

懂球帝 浏览 4954 07-13

边打字边出片,交互式生成长视频!英伟达联合MIT开源新SOTA

新智元 浏览 275 10-18

缅甸突袭KK园区后引发"招聘潮" 有人被7万美元"转卖"

红星新闻 浏览 227 11-06

冰红茶大战开启,有糖茶回归

斑马消费 浏览 6028 08-13

库明加情况与杰伦-格林类似 接受资质报价对他和勇士而言或是双输

直播吧 浏览 5943 07-29

叙利亚迎"历史性时刻":领导人近60年来首次在联大发言

澎湃新闻 浏览 393 09-26

特朗普对援乌态度"巨大转变" 或动用"总统特别拨款权"

澎湃新闻 浏览 7839 07-12

经典落幕:苹果正式将初代iPhone SE列为过时产品

环球网资讯 浏览 188 12-02

特朗普签总统令"动真格" 英高层:九三阅兵"吓坏"西方

梁讯 浏览 657 09-11

推广|| 双11来了!好口碑国货返场,买1送20

黎贝卡的异想世界 浏览 289 10-14

"山寨车鼻祖"工厂成零件坟场 曾模仿豪车被称"保时泰"

第一财经资讯 浏览 385 09-16

中国中产的坑,美国二十年前已经踩过一遍了(二)

虎嗅APP 浏览 8331 07-12

英国官员:美欧都在和中国交流 我们却几乎没有接触

澎湃新闻 浏览 549 09-02

奇瑞QQ3量产版曝光! 轴距2米7配8155芯片

Ai爱车 浏览 192 01-01

零跑汽车引入一汽作为大股东,朱江明回应控制权不变

财闻 浏览 182 12-29

AI成核心方向 银行启动博士后招聘

北京商报 浏览 196 11-25

意足协主席:俱乐部所有者应加大对欧洲杯举办球场的投资力度

懂球帝 浏览 5620 07-25

全系标配800V/续航700km 智己LS7焕新版售32.99万

网易汽车 浏览 488 06-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11