关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025437人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“无人机+小飞人”带电作业 助力世运会保电

封面新闻 浏览 4763 07-27

李亚鹏带货卖超千万?网友说他是不会蹭热度的人

安宁007 浏览 274 01-19

欧盟27国中26国支持乌克兰入盟 发布领导人声明

鲁中晨报 浏览 3189 08-13

加速进化抢单“双11”

北京商报 浏览 347 10-28

不要怀疑任何一张能进内娱的脸

时尚COSMO 浏览 3675 07-21

梅西:上周末他们没让我上场 ,今天比赛一开始感觉身体有些沉重

直播吧 浏览 10178 07-31

汪小菲信守承诺带娃玩,小玥儿正脸太像大S

观察鉴娱 浏览 8603 07-08

黄晓明也没想到,前妻没给他留一丝体面

趣文说娱 浏览 2529 08-10

预计1亿欧图片报:利物浦已告知法兰克福 愿支付埃基蒂克要价

直播吧 浏览 1969 07-18

牛弹琴:高市早苗有点悬了 女首相之路出现重大波折

现代快报 浏览 369 10-11

张本智和惨遭逆转!痛失4个赛点+连丢3局,无缘法国冠军赛男单8强

乒谈 浏览 308 11-01

全国首创 双流机场上线免费行李配送

红星新闻 浏览 503 08-22

王阳评论区沦陷!网友怒斥他太虚伪,背刺孙菲菲人品遭质疑

萌神木木 浏览 3732 07-09

首款可折叠iPhone最新消息:或在2026年秋季发布

环球网资讯 浏览 327 12-02

中国信达减持方正证券,再次“轮空”!

券商中国 浏览 5812 07-31

突然!全线暴跌,发生了什么?

券商中国 浏览 473 09-02

AI芯片需求强劲,台积电Q2营收大涨38.6%,净利润激增61%

华尔街见闻官方 浏览 3467 07-18

金价跌破3900美元 大学女生下跌时补仓结果亏得更多

每日经济新闻 浏览 291 10-29

爆冷!莫布利29+8骑士崩盘输猛龙 巴特尔三分6中6引3人20+

醉卧浮生 浏览 355 11-01

苹果芯片不够用了

北京商报 浏览 288 02-02

香港大重置

巨潮WAVE 浏览 4797 08-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11