关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025433人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

采用900V高压架构 蔚来ES9将于5月27日上市

车质网 浏览 124 05-07

许尔策勒:我百分百确定巴莱巴留在布莱顿

懂球帝 浏览 494 08-29

拼多多狠起来,连自己都砍一刀

说财猫 浏览 480 08-27

小贝林父母被禁止进入多特更衣室?里肯:我们之间的关系很好

懂球帝 浏览 493 08-26

人工智能应用让群众网球赛事更有“科技范”

环球网资讯 浏览 5669 07-13

美国11月ISM制造业PMI萎缩幅度创四个月最大,就业进一步收缩,价格涨

华尔街见闻官方 浏览 260 12-02

NVIDIA研究团队打造"思考-表达"双模式AI

科技行者 浏览 255 01-23

44岁郭晶晶看车被偶遇,素颜白发撞脸董明珠

小威说AI 浏览 294 01-09

从“现金补贴”到“学费减负”,养娃能省多少钱?

野马财经 浏览 7182 08-07

涉嫌严重违纪违法 副厅长李俊丰任上被查

鲁中晨报 浏览 623 08-14

成龙自曝家里有弹药库,3000杆枪10万发子弹,他的特权远不止这些

不八卦会死星人 浏览 506 08-22

特朗普:美特使本周访俄 若俄不停火将实施制裁

极目新闻 浏览 9485 08-05

男子寄107万元油卡遭快递员变卖:顺丰仅愿赔偿2500元

南国今报 浏览 2135 07-17

罗马诺:米兰与德温特就个人条款达成一致,正在与热那亚谈判

懂球帝 浏览 9383 08-11

AI引擎,价值跃迁,欧定品牌缔造出海新篇章

新周刊 浏览 561 08-11

格拉斯纳:期待与埃泽的碰面,但在比赛中我们只会全力争胜

懂球帝 浏览 330 10-25

宗馥莉在遗产案后首次公开回应:不会因为风波改变方向

南方都市报 浏览 664 08-28

高市早苗求见特朗普要聊聊中国 美国没憋住开口"帮腔"

观察者网 浏览 319 12-11

俞敏洪宣布东方甄选旗下账号停播一天

三言科技 浏览 2104 07-25

NBA版落叶归根!利拉德保罗重回巅峰故地 卡佩拉梦回航天城

直播吧 浏览 1795 07-22

泰国海军做好战争准备 特朗普要电话调停泰柬冲突

环球网资讯 浏览 289 12-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11