关闭广告

OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了

机器之心Pro2025-08-13 12:00:013383人阅读



机器之心报道

编辑:Panda

前些天,OpenAI 少见地 Open 了一回,发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。

但是,这两个模型都是推理模型,OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。然而,发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法,DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。

近日,Cornell Tech 博士生、Meta 研究员 Jack Morris 决定自己动手填补这一空白。

他昨天在 上表示已经搞清楚了如何撤销 gpt-oss 模型的强化学习,让其回退成基础模型。他还宣布将在今天发布他得到的基础模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

LLM把简单任务复杂化,Karpathy无语:有些任务无需那么多思考

机器之心Pro 浏览 9651 08-12

2025WAIC“人工智能精英夜话”定档:第一财经携手共探AI产业化应用价值脉络

第一财经资讯 浏览 3065 07-15

14岁休学少女进拓展营后死亡 曾哭喊"妈妈我不想死"

新京报 浏览 221 09-29

比亚迪元PLUS迎来史诗级升级,续航或超650km!

刘哥谈体育 浏览 51 11-09

意甲主席:因球场问题,我很担心2032年欧洲杯申办资格被撤销

懂球帝 浏览 263 08-26

中国与澳大利亚签署关于实施和审议中澳自贸协定的谅解备忘录

商务部网站 浏览 3918 07-16

中国被列入承认巴勒斯坦国国家名单 台当局跳出来了

环球网资讯 浏览 180 09-25

光大银行修订公司章程,董事长党委书记分设略微“松口”

财经众议院 浏览 8253 07-12

满满的爱,哈登出席村BA活动揭幕专属球场,冒雨为球迷签名

懂球帝 浏览 4027 08-07

国产运动鞋服品牌上半年“成绩单”揭晓 细分品类“加速跑”

中国商报 浏览 6159 07-28

集采倒逼传统药企转型,多家企业创新药收入贡献过半

第一财经资讯 浏览 265 08-26

这个盛夏7月,L3开始重塑智驾格局

帮宁工作室 浏览 1826 07-19

美媒承认乌重镇即将被攻克:俄方为此付出了很大代价

环球时报国际 浏览 53 11-10

上海U20男足进全运8强,徐根宝:出线是第一位,成绩是硬道理

懂球帝 浏览 61 11-06

美国忠实航空一客机因炸弹威胁空中折返

极目新闻 浏览 6343 07-07

49岁连饭都不会做,反被陆毅宠了28年

小张帅 浏览 163 09-21

4年1亿!Shams:吉迪合同为完全保障 不含任何球员或球队选项

直播吧 浏览 180 09-10

外国女教师性侵16岁男学生数月上百次 详情炸裂

胡侃社会百态 浏览 210 09-29

AI可穿戴相机Looki L1发布!美团前高管创业,三轮融资过千万美金

雷科技 浏览 202 09-01

朱迅:为缅怀母亲,演唱歌曲《蓝天上的云》

晓今娱 浏览 1190 08-11

保安被同事推倒昏迷多月未醒 女儿:警方立为行政案件

扬子晚报 浏览 968 08-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11