关闭广告

OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了

机器之心Pro2025-08-13 12:00:013547人阅读



机器之心报道

编辑:Panda

前些天,OpenAI 少见地 Open 了一回,发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。

但是,这两个模型都是推理模型,OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。然而,发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法,DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。

近日,Cornell Tech 博士生、Meta 研究员 Jack Morris 决定自己动手填补这一空白。

他昨天在 上表示已经搞清楚了如何撤销 gpt-oss 模型的强化学习,让其回退成基础模型。他还宣布将在今天发布他得到的基础模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国经济上半年同比增长5.3% 储备政策将择机而出

21世纪经济报道 浏览 3116 07-16

甘肃银行“将帅”或迎重大调整,该如何打破增长瓶颈?

Daily每日财报 浏览 7267 08-06

《扫毒风暴》大结局收官!卢少骅死刑罪有应得,林队牺牲意难平

电和影 浏览 4099 07-28

苏有朋,祸从口出?

会说话的舌 浏览 347 09-02

机场航站楼有人坠落砸死保洁员 目击者:听到尖叫声

极目新闻 浏览 479 08-22

天空体育记者:伊萨克已抵达纽卡训练基地,将进行单独训练/恢复

直播吧 浏览 4237 08-07

午评:创业板指半日跌1.77% 黄金概念股逆势大涨

网易财经 浏览 331 09-09

横滨胜王楚钦后立Flag!张本智和:目标是世界第一,因此不能休息

直播吧 浏览 1259 08-14

河南"妻儿三人被发小杀害案"宣判:被告人获死刑

红星新闻 浏览 207 12-24

特朗普就印巴停火"邀功"后 印方迅速放出消息

环球时报 浏览 8514 05-11

欧盟官员:特朗普政府未表现出谈判诚意 已准备好反制

每日经济新闻 浏览 5490 07-10

印媒:应对特朗普关税战 中国对印度喊出一句话

澎湃新闻 浏览 892 08-20

涉嫌支持台军心战大队 5家企业主营业务被曝光

日月谭天 浏览 187 10-18

“货车侧撞+固定柱体夹击”连环碰撞你受得了吗?奥迪Q6L e-tron:小意思!

封面新闻 浏览 2323 07-16

印公布首艘核动力航母研制时间表

环球网资讯 浏览 373 09-09

13天拍摄+80万刀投资能拍出怎样的杰作?

电影最TOP 浏览 9153 08-07

官方回应"孕妇遭两男子殴打住院":一打人者系公职人员

扬子晚报 浏览 1229 07-16

ChatGPT跟进阿福,AI健康按下快进键

海克财经 浏览 195 01-11

媒体:欧盟"外长"妄议九三阅兵 话说得比特朗普还过分

新民周刊 浏览 454 09-07

赵少康为何不参选国民党主席 陈文茜:他怕妻女怕得要死

海峡导报社 浏览 268 10-28

传奇数学家放弃美国高校终身教职 为00后中国女孩打工

新民周刊 浏览 188 01-02
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11