关闭广告

OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了

机器之心Pro2025-08-13 12:00:013553人阅读



机器之心报道

编辑:Panda

前些天,OpenAI 少见地 Open 了一回,发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。

但是,这两个模型都是推理模型,OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。然而,发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法,DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。

近日,Cornell Tech 博士生、Meta 研究员 Jack Morris 决定自己动手填补这一空白。

他昨天在 上表示已经搞清楚了如何撤销 gpt-oss 模型的强化学习,让其回退成基础模型。他还宣布将在今天发布他得到的基础模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普"翻脸" 印媒发问:印美关系怎么了

上观新闻 浏览 791 08-06

还是不高!新赛季NBA的国际球员买断费上限为87.5万美元

直播吧 浏览 5699 08-13

同演女将军,18岁黄杨钿甜和38岁赵丽颖对比

肆季娱乐 浏览 74 04-10

湖记:约基奇字母都是不切实际交易目标 他们想来我们也出不起价

直播吧 浏览 6664 08-14

越南U21女排因有球员未通过染色体检测,世锦赛成绩被取消

懂球帝 浏览 5479 08-13

以军空袭也门首都萨那 以色列多地拉响防空警报

上观新闻 浏览 316 09-26

上海飞芬兰一航班落地后突发意外 事故原因公布

新民晚报 浏览 341 08-30

一年连关两厂,风靡全国的顶流养乐多为啥没人买了?

江瀚视野 浏览 233 11-08

上海两大机场部分航班实现不取行李、无感中转

上观新闻 浏览 8314 07-25

中乙综述:泰山B队3球大胜升至北区第二 广西蓝航5球惨败未尝一胜

直播吧 浏览 10050 07-14

15000mAh!真我海外预热超大电池容量手机

IT之家 浏览 408 08-24

REDMI Note 15 Pro将搭载1.5K超级阳光屏,峰值亮度达3200尼特

IT之家 浏览 438 08-19

近百台小米YU7流入二手车市场:比新车贵1万多 当天可提

极目新闻 浏览 2840 07-21

苹果预计今年不会发布标准版 iPhone 18 推迟到 2027 年

威锋网 浏览 183 01-05

飞机落地前田栩宁粉丝闯机舱追星 乘务员阻拦无果 现场混乱

大象新闻 浏览 8007 07-10

周受资,晋升一位90后女将

华尔街见闻官方 浏览 252 10-26

披头发太热了!今夏爆火的4款编发,巨美巨清凉!

Yuki女人故事 浏览 4949 07-27

蔚来艰难求盈利

北京商报 浏览 198 11-27

五菱之光EV新车型增加续航,5万块的生产力工具成色几何?

经济观察报 浏览 2157 07-29

库明加与勇士的续约僵局:最好、最差和最现实的三种结局分析

直播吧 浏览 340 09-09

拼多多新质供给一周年:新质商品SKU数增长超五成,产业加速新质转型

财闻 浏览 312 09-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11