关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025346人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

推广中奖名单-更新至2025年9月30日推广

黎贝卡的异想世界 浏览 310 10-12

特朗普刚签中美"休战令" 大批对华强硬美官员萌生退意

博览历史 浏览 8315 08-13

马天宇在北京开农场,种菜养鸡、自己劈柴做饭

悠闲历史 浏览 443 08-18

不要怀疑任何一张能进内娱的脸

时尚COSMO 浏览 3607 07-21

多家银行发声抵制“内卷式竞争”

21金融圈 浏览 1675 07-31

以突袭哈马斯领导人办公室 白宫:消灭哈马斯值得追求

上游新闻 浏览 469 09-10

为什么说本田这个“内燃机之王”,在国内被严重低估了

少数派报告Report 浏览 187 12-15

多重重压下 波音下调未来20年全球新飞机需求预期

财联社 浏览 4917 06-15

多家老牌餐饮店被仿冒 官方介入后仿冒店连夜拆除招牌

红星新闻 浏览 408 09-10

女子取240万现金"给外甥当彩礼" 外甥:根本没有对象

环球网资讯 浏览 191 01-09

特朗普考虑直接动武 拉美怒了做出强硬回应

澎湃新闻 浏览 9023 08-10

硅谷三巨头齐放大招,现在就等梁文锋了

字母榜 浏览 9276 08-07

特朗普就印巴停火"邀功"后 印方迅速放出消息

环球时报 浏览 8521 05-11

‍曼联向韦伯投诉裁判误判!曝阿莫林将用442,赛季成败在此一举

罗米的曼联博客 浏览 175 12-19

雷军说YU7有不可替代的魅力 5月22日发布

网易汽车 浏览 446 05-22

2025羽绒服8大流行趋势,温暖时髦过冬天!

LinkFashion 浏览 197 11-05

股市:三个积极信号!

小白读财经 浏览 206 12-23

男子晒妈妈亲手缝的"NIKE"书包火了 收到800多万点赞

大象新闻 浏览 420 09-16

量子位「MEET2026智能未来大会」启动!年度榜单征集中

量子位 浏览 263 10-19

年味拉满,好笑戳心,春节档还得看他们!

吐槽电影院 浏览 148 02-24

惨!吴京新片上映就被匆匆抬走,5天票房仅25万,亏的底裤都不剩

娱乐圈笔娱君 浏览 407 08-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11