关闭广告

让AI看懂长电影,这位准博士生想找到智能的真实边界

DeepTech深科技2025-08-11 00:00:028127人阅读

Next Gen

欢迎来到“Next Gen”。人工智能的边界每日都在被拓展,一群富有远见卓识的青年学者正站在浪潮之巅。我们追踪并报道这些 AI 领域最具潜力的明日之星,展现他们在科研前沿的突破性工作,以及对未来智能时代的独到见解。他们是谁?他们如何思考?他们又将把 AI 带向何方?与我们一同发现那些正在定义未来的 AI 新生代。

“我觉得 benchmark 要么你足够难,难到模型都没办法解决,要么你足够贴近现实生活。”

当 OpenAI 的 o4-mini-high、Google 的 Gemini 2.5 Pro 等前沿模型在困难编程题上集体拿到 0 分时,这条标准被直观地验证了。给出这组让人意外的成绩,是LiveCodeBench Pro——一个由普林斯顿大学准博士生柴文浩与团队构建的算法竞赛基准。


图丨柴文浩(来源:柴文浩)

出身数学竞赛的柴文浩,正用自己的视角重估 AI 能力的真实边界

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这部逃亡故事,为何被无数大师引为平生挚爱

幕味儿 浏览 475 08-22

海博思创400多亿市值背后,留美博士张剑辉的逆袭之路

尺度商业 浏览 184 12-23

马杜罗在纽约首次“出庭” 多国发表联合声明

环球网资讯 浏览 200 01-06

网友质疑小米骗取国补:净水器非国补地区能便宜600元

潇湘晨报 浏览 2127 08-06

记者:那不勒斯正式报价乌迪内斯,洛伦佐-卢卡越来越接近加盟

直播吧 浏览 1273 07-16

传奇数学家放弃美国高校终身教职 为00后中国女孩打工

新民周刊 浏览 191 01-02

泰国出动4架战机空袭柬埔寨 还在柬沿海部署8艘军舰

每日经济新闻 浏览 10519 07-27

"体检10年未发现患癌"当事人:非常期待爱康国宾起诉我

红星新闻 浏览 4886 07-31

荣耀 Magic5 系列手机获 MagicOS 9.0.0.187 版本升级

IT之家 浏览 450 08-22

WAIC上的“最强大脑”对话:机器人如何走向真实世界?

南方都市报 浏览 1263 07-30

NBA夏联:谢泼德18分4断6失误领一级恶犯 火箭负活塞吞两连败

罗说NBA 浏览 2487 07-14

抗500 ℃高温和-183 ℃极寒 上海为新一代运载火箭打造“防护铠甲”

上观新闻 浏览 417 08-26

46岁侯佩岑和51岁朱迅站在一起 顶级骨相绝了

新语爱八卦 浏览 1230 07-17

央行:前五个月人民币存款增加14.73万亿元

财联社 浏览 3367 06-14

高考数学满分的他,说要成为1/3个邓肯

后厂村体工队 浏览 5033 07-14

E句话 | 宗家剧情引入新道具宗氏族谱?

仙女事件簿 浏览 2393 07-18

资深天使投资人肖庆平在西藏车祸离世 朋友圈内容披露

都市快报橙柿互动 浏览 285 10-09

被奔驰逼停摩托车主:不追究了太折腾 照程序走就行了

大象新闻 浏览 9154 08-06

迪马:博尼费斯告吹后,米兰现在的头号目标是康拉德-哈德

懂球帝 浏览 454 08-25

“老登股”列传I:海天味业,匆匆忙忙跌跌撞撞这五年

锦缎研究院 浏览 267 10-16

美国纽约州一旅游大巴翻车 5人死亡数十人受伤

财联社 浏览 441 08-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11