关闭广告

OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了

机器之心Pro2025-08-13 12:00:013650人阅读



机器之心报道

编辑:Panda

前些天,OpenAI 少见地 Open 了一回,发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。

但是,这两个模型都是推理模型,OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。然而,发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法,DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。

近日,Cornell Tech 博士生、Meta 研究员 Jack Morris 决定自己动手填补这一空白。

他昨天在 上表示已经搞清楚了如何撤销 gpt-oss 模型的强化学习,让其回退成基础模型。他还宣布将在今天发布他得到的基础模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

东北大妈140亿“黑金”豪门,彻底覆灭了

大猫财经Pro 浏览 288 01-20

《财富》世界500强:130家中国公司上榜,华为重回前100

澎湃新闻 浏览 4486 07-30

杉杉集团重整突生变数,“民营船王”695亿资本局悬了?

野马财经 浏览 290 11-06

你们猜谁会迷失在电动浪潮中?

汽车公社 浏览 411 10-25

法官毕祺祺涉洗钱犯罪被批准逮捕 曾因"为母辩护"走红

江苏新闻 浏览 1565 08-11

搞"七个有之"窦万贵获死缓:长期在新疆工作 敛财超2亿

政知新媒体 浏览 3966 07-10

国常会:部署逐步推行免费学前教育有关举措

新京报 浏览 6096 07-26

林依晨二胎喜讯背后:被造谣7年生吃青蛙的十年婚变史

Yuki女人故事 浏览 413 09-20

50+女人的穿衣指南:亮一点,松一点,美得比年轻姑娘有味道

静儿时尚达人 浏览 480 08-29

韩军机未经许可进入日本领空 日方紧急出动战机应对

环球网资讯 浏览 9096 07-25

京东外卖全职骑手突破15万,人均缴金约2000元/月

第一财经资讯 浏览 523 08-19

明确容错边界,让科研人员轻装跃进

南方都市报 浏览 2914 07-15

全球AI云竞赛,阿里靠什么打?

虎嗅APP 浏览 424 09-21

病毒学家李文辉:打开乙肝病毒之门

经济观察报 浏览 1690 07-14

首富卷入惊天丑闻,妻子被瞒一无所知

Yuki女人故事 浏览 248 02-05

300多韩国工人在美被关押细节:双手被绑 喝水靠舔

红星新闻 浏览 546 09-18

PEEK材料概念大涨,中欣氟材收获5天4板

览富财经网 浏览 10336 08-12

卫报:欧冠决赛英国非法播放量超1620万次,合法观众700多万人

懂球帝 浏览 65 06-02

许嵩冯禧被曝秘密结婚!男方家人正筹备婚礼,妈妈曾点赞催婚评论

萌神木木 浏览 5235 08-07

月之暗面发布并开源Kimi K2模型

环球网资讯 浏览 9594 07-12

一群人闯进女子刚买的新房砸了两面墙 物业称出于好心

杭州交通918 浏览 242 04-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11