关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025430人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

孙菲菲感谢霍思燕为其打抱不平,感叹男人过于精明,没女人有担当

扒虾侃娱 浏览 6813 07-14

两架运-20飞往阿富汗

政知新媒体 浏览 449 09-08

特朗普在10天内4次誓言"拿下格陵兰" 强调"不择手段"

扬子晚报 浏览 303 01-21

中科大和华为联手破解大语言模型"注意力"背后的神秘规律

科技行者 浏览 295 02-04

特朗普表示希望尽快访华 外交部回应

北京日报客户端 浏览 645 08-27

菲称中国就东南亚无核区做样子 媒体:不该惯其臭毛病

新民周刊 浏览 4141 07-16

姚晨:自然予我

时尚COSMO 浏览 407 09-25

后摩智能发布端边大模型AI芯片 吴强:让 AI 算力像电一样方便好用

网易科技报道 浏览 2004 07-26

以军官否认在加沙滥杀无辜 清华教授阎学通当场驳斥

看看新闻Knews 浏览 40287 09-19

游泳世锦赛奖牌榜:中国队10金位列榜首,澳大利亚第二、德国第三

直播吧 浏览 1912 07-29

这家公司上市前后业绩反差大!现开启跨界并购……

IPO日报 浏览 3027 07-12

夏天衣服不用准备太多,这几件单品可常备,日常穿搭绰绰有余

静儿时尚达人 浏览 6651 06-13

全网首个爆料Manus裁员消息的人,如何看待其彻底撤出中国一事?

钛媒体APP 浏览 10704 07-13

纯电续航增加 新款蓝电E5 PLUS将于11月预售

车质网 浏览 375 09-30

7天票房2.3亿,差评满天飞的“大烂片”被捧上日冠,中国观众咋了

娱乐圈笔娱君 浏览 273 01-07

特朗普称伊朗核设施已被“彻底摧毁”

环球时报 浏览 1968 06-22

NBA战报:马刺133-104大胜步行者取NBA5连胜,文班亚马17+12+1

懂球帝 浏览 390 10-18

塔帅:哲凯赖什明天可能会出场;新赛季目标是比上赛季更好

懂球帝 浏览 10445 07-31

大桥垮塌司机悬空获救 救援队:我们救灾顺路把他救了

大风新闻 浏览 7576 06-25

《我不是药神》原型陆勇时隔5年重返印度

红星新闻 浏览 304 01-12

俄乌冲突升级 乌军一架米格-29战斗机失事飞行员死亡

每日经济新闻 浏览 622 08-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11