关闭广告

OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了

机器之心Pro2025-08-13 12:00:013646人阅读



机器之心报道

编辑:Panda

前些天,OpenAI 少见地 Open 了一回,发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。

但是,这两个模型都是推理模型,OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。然而,发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法,DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。

近日,Cornell Tech 博士生、Meta 研究员 Jack Morris 决定自己动手填补这一空白。

他昨天在 上表示已经搞清楚了如何撤销 gpt-oss 模型的强化学习,让其回退成基础模型。他还宣布将在今天发布他得到的基础模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

石破茂辞职后两人有望接任 日本自民党或迎首位女总裁

时代周报 浏览 555 09-08

湖南第二城打上“烧烤牌”,实际想要什么?

时代周报 浏览 8766 07-27

上千网友帮女孩杀猪 主厨:这么多张嘴挂身上压力太大

极目新闻 浏览 257 01-13

"昆仑石刻"是否为今人伪刻引争议 牧民称40年前曾见过

每日经济新闻 浏览 2244 07-11

汉密尔顿:向车队道歉;这赛季已经结束了,把重点放到明年吧

懂球帝 浏览 5209 07-27

千亿麻辣烫江湖,面临成长的烦恼

斑马消费 浏览 466 09-11

玥儿太像大S了,汪小菲看女儿的眼神好宠溺

动物奇奇怪怪 浏览 5243 07-16

河南女孩带村里46名老人游郑州 有人穿得比结婚还整齐

极目新闻 浏览 660 08-21

火爆全网的LV巧克力关门了?为啥奢侈品巧克力做不下去?

江瀚视野 浏览 501 08-19

20万就能落地这3款豪华B级车 难道还不抄底?

优视汽车 浏览 553 05-17

媒体人:前NBA乐透秀班巴收到CBA球队高额报价,税前超300万

懂球帝 浏览 446 08-22

伊朗革命卫队称对美空军基地进行打击

新华社 浏览 77 05-28

32岁黄子韬径山寺祈福,生图脸肿嘴黑金发毛躁,走路抻脖毫无星味

洲洲影视娱评 浏览 213 03-11

“太空快递”签收后航天员在忙什么?中国空间站多领域新实验上线

IT之家 浏览 10046 07-27

权威机构发新榜单!小米SU7同级质量最好

小李车评李建红 浏览 582 06-16

孙艺珍亮相釜山电影节,穿粉色吊带裙被网友吐槽

笑猫说说 浏览 349 09-18

定下“适度宽松”基调半年后,交了一份什么“答卷”?

国是直通车 浏览 1214 07-15

伊朗:美福特号航母在红海的存在 被视为对伊朗的威胁

国际在线 浏览 202 03-16

小米SU7 Ultra从爆款预定到退货潮!雷军遭遇创业最大危机

网上车市 浏览 498 05-13

港星黄泽锋58岁妻子产女!年过五旬连生二胎,差点因并发症送命

萌神木木 浏览 466 09-06

多家韩媒对美方表达强烈抗议:像被人从背后捅了一刀

环球网资讯 浏览 481 09-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11