关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025165人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

勇士将底薪签小库里+小佩顿:库里兄弟联手

醉卧浮生 浏览 6900 08-06

博主自制“左撇子版”罗技 MX Master 3 鼠标改造套件

IT之家 浏览 8846 07-13

19岁女孩当"台球美女助教" 月入过万被客人开黄色玩笑

极目新闻 浏览 3201 08-11

美国向欧盟、墨西哥发出"关税通牒" 盟友强硬回怼

大象新闻 浏览 7118 07-13

张艺兴跑外卖给聋人粉丝送演唱会门票,引质疑?

动物奇奇怪怪 浏览 2272 07-30

尼科-帕斯:从小我的偶像就是梅西,我看了阿根廷国家队所有比赛

直播吧 浏览 301 08-12

媒体人:阻碍中国篮球发展因素太多 希望杨瀚森亚洲杯出工少出力吧

直播吧 浏览 2925 07-24

伊朗:三处遭袭核设施未发现污染迹象

界面新闻 浏览 9699 06-23

普京赠送美国一居民新摩托 生产商:俄方要得很急

鲁中晨报 浏览 291 08-20

从灶台到屏幕:一位餐饮老炮的抖音破局之路

餐饮老板内参 浏览 260 08-26

两部门征求意见:辅助驾驶不能当自动驾驶!未经备案OTA不得升级

极目新闻 浏览 6088 08-14

阿里没有重启口碑 大众点评重启了"品质外卖"!

野马财经 浏览 200 09-11

英特尔宣布,57亿美元到账,投资者先炸了

网易科技报道 浏览 248 08-29

东京车展首发 曝丰田世极轿跑SUV概念车官图

车质网 浏览 122 10-14

世体:拉波尔塔周一中午抵达体育城,向球队重申支持和鼓励

懂球帝 浏览 86 10-28

美政府想"断供"马斯克旗下航天企业 但发现离不开

国际在线 浏览 7414 07-21

抗衰赛道持续扩容,Swisse PLUS能否成为健合集团(01112)的增长引擎?

猛犸资本局 浏览 38 11-11

采用方盒子造型 方程豹钛7预告图发布

车质网 浏览 265 06-10

委内瑞拉总统:与美政府中断一切联系

界面新闻 浏览 263 09-17

张碧晨陷原唱风波 汪苏泷已给足体面 还是被打脸

联友军事 浏览 5978 07-29

珠海收获2金!广东省无人机应用技术职业技能大赛结果揭晓

南方都市报 浏览 30 11-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11