关闭广告

OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了

机器之心Pro2025-08-13 12:00:013551人阅读



机器之心报道

编辑:Panda

前些天,OpenAI 少见地 Open 了一回,发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。

但是,这两个模型都是推理模型,OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。然而,发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法,DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。

近日,Cornell Tech 博士生、Meta 研究员 Jack Morris 决定自己动手填补这一空白。

他昨天在 上表示已经搞清楚了如何撤销 gpt-oss 模型的强化学习,让其回退成基础模型。他还宣布将在今天发布他得到的基础模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

莫迪连续四次拒接特朗普来电 印度硬刚美国关税大棒

第一财经资讯 浏览 553 08-29

超100万观众打出9.6分,票房破10亿?成龙新片或是暑期档大黑马

靠谱电影君 浏览 6766 08-14

郑州五星级酒店摆地摊1天进账3万 杭州也有酒店开始了

鲁中晨报 浏览 9349 07-09

中国女足近11次对澳大利亚未尝胜绩,但在亚洲杯还没输过对方

懂球帝 浏览 108 03-17

起底狙击宇树科技的日化公司:幕后老板已被限高,掌握专利超120项,涉多起纠纷

红星资本局 浏览 421 08-27

米体:卢克曼无论付出多大代价都不想回归亚特兰大

懂球帝 浏览 9931 08-10

周二非农拯救美股?大摩首席:就业疲软或助股市走高

华尔街见闻官方 浏览 225 12-16

《向往8》暴露明星真实性格!张子枫老实,何炅诙谐,黄磊最强势

娱乐圈笔娱君 浏览 289 10-12

中国移动灵犀智能体产品族全面落地荣耀 AI 手机

IT之家 浏览 347 09-10

Here we go!罗马诺:迈阿密国际20岁中场克雷马斯基租借帕尔马

直播吧 浏览 351 09-01

索汉:很遗憾因伤无法代表波兰参加欧锦赛 不会影响新赛季训练营

直播吧 浏览 778 08-11

搭载三缸发动机 2026款日产奇骏官图发布

车质网 浏览 1597 07-31

《生万物》结局烂尾,杨幂离得奖越来越远,38岁了光有进步可不够

萌神木木 浏览 436 08-25

Nebius接微软最高194亿美元AI算力大单,盘后一度涨超60%

华尔街见闻官方 浏览 377 09-09

今年春天最流行的4件卫衣,照着穿就很好看

LinkFashion 浏览 126 03-01

欧盟“暂停”报复性关税,但价值930亿欧元反制清单待命

国际金融报 浏览 2883 07-15

张柏芝仅用一招就让自己口碑暴增?

娱乐圈笔娱君 浏览 271 10-29

美方突击搜查 韩企工人:像"战区"一样 有人躲通风管

红星新闻 浏览 370 09-09

A股,突破新高了!

小白读财经 浏览 459 08-13

世界最大航空发射场 拜科努尔今年70岁

环球网资讯 浏览 9001 06-30

罗马诺:阿贾克斯即将与富安健洋签约半年,根据表现可能续约

懂球帝 浏览 219 12-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11