关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025342人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

抗衰赛道持续扩容,Swisse PLUS能否成为健合集团(01112)的增长引擎?

猛犸资本局 浏览 224 11-11

法媒:尼斯前锋拉博德将加盟沙特迪里耶,转会费约500万欧

懂球帝 浏览 5366 07-16

中金:简评深圳住房限购政策调整

365财经plus 浏览 285 09-09

苹果史上最大升级!iPhone 17系列汇总:首次标配高刷、超薄Air登场

快科技 浏览 6452 07-22

经常便血,是痔疮还是直肠癌?

网易健康 浏览 8162 02-26

50米蛙泳冠军切拉索洛:尤文图斯是我生命的一部分

懂球帝 浏览 2584 08-07

TA:孙兴慜渐别巅峰但弗兰克难撤首发 马竞有意罗梅罗或可套现他

直播吧 浏览 2504 07-15

“比特币富婆”钱志敏在英国认罪,6.1万枚比特币市价已达493亿元,赃款归谁?

红星新闻 浏览 240 11-01

全锦赛:江苏女篮40分狂胜山东晋级决赛 马文20分罗欣棫14+7

醉卧浮生 浏览 281 10-17

你看到的不是奔驰纯电CLA,而是汽车的下一个20年

1号车盟 浏览 178 12-02

阿里到店:高德打第一枪,但重头戏尚未登场

刺猬公社 浏览 347 09-11

自称窦骁前女友发声!内涵他目的性极强爱交富家女,很理解何超莲

萌神木木 浏览 269 10-23

全新一代大众探歌预告图亮相:首次尝试油电混动,拟在华生产

IT之家 浏览 421 08-19

曝辛芷蕾翟天临分手原因,男方无缝衔接新欢,辛芷蕾情伤后冲事业

萌神木木 浏览 361 09-08

火爆全网的LV巧克力关门了?为啥奢侈品巧克力做不下去?

江瀚视野 浏览 409 08-19

超燃!100秒看大阅兵徒步方队

人民日报 浏览 288 09-04

TA夸怀特、哲凯赖什和苏比门迪:各展所长,共同铸就关键胜利

懂球帝 浏览 210 01-16

詹姆斯未来去向成谜 湖人管理层掌门如何回应?

体坛周报 浏览 354 09-26

极具科技感 保时捷纯电Cayenne最新谍照曝光

车质网 浏览 445 06-13

短期内可生产大量武器级钚 专家分析日本暗藏“核武野心”

环球网资讯 浏览 199 11-23

胜利精密连续亏损三年半,主营业务毛利率回升,公司称历史包袱基本解决

时代周报 浏览 435 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11