关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025438人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以色列空袭叙利亚首都 叙利亚政权领导人首次发声

环球网资讯 浏览 4203 07-18

一名日本男子以间谍罪获刑12年 外交部介绍情况

北京青年报 浏览 2744 05-15

这个季节高发!中国2亿人被它折磨

科普中国 浏览 5901 06-03

英伟达CES亮出新牌

北京商报 浏览 301 01-07

应对以伊冲突 特朗普提前退席七国集团峰会

新华社 浏览 3034 06-18

男子申请"777777"靓号转网被拒 桂林电信:得领导同意

大风新闻 浏览 10677 08-13

牛弹琴:以色列突然袭击叙利亚首都 又一场大战开打了

现代快报 浏览 2459 07-17

独家对话新京熹创始人段誉:餐饮未来增长,“拼”什么?

餐饮老板内参 浏览 372 10-02

特朗普下令立即重启美国核试验 以应对其他国家核威胁

中安在线 浏览 197 10-31

阿斯:在经历了两年的苦难后,里沙利松终于迎来了重生

懂球帝 浏览 523 08-20

梅西世界杯戴帽超C罗!历史射手王不是他的极限:能不能再进11球

念洲 浏览 13 06-17

中国手机季度出货下滑4%:华为重夺第一,小米苹果并列

观察者网 浏览 7689 07-30

专家:中美俄将坐一张谈判桌谈俄乌问题 中国应更主动

澎湃新闻 浏览 658 08-27

湖南银行董事会成员调整,11位董事候选人简历公布

湘财Plus 浏览 67 06-02

官方:瓦斯科达伽马与35岁前江苏队外援特谢拉解约

直播吧 浏览 467 09-11

马赛主席在从曼联签下梅森·格林伍德前询问了他的母亲

绿茵情报局 浏览 287 01-27

黄金、白银突然暴跌!发生了什么?

中国品牌 浏览 256 10-22

6人坠浮选槽1小时才救出第一人 专业人员:救援队到太晚

红星新闻 浏览 5518 07-26

利润暴跌99%,保时捷赚不到钱了?

汽车公社 浏览 261 10-28

35个品牌混战大剧,每日鲜语如何实现品效霸屏?

DT商业观察 浏览 6410 07-29

直击MWC2026|AI重构通信网络,6G“卡位战”提前到来

第一财经资讯 浏览 261 03-03
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11