关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025340人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

对话比亚迪路天:王朝的真正对手 是"未来的自己"

网易汽车 浏览 198 11-27

特朗普扬言:美国已经变成了一个真正的联合国

参考消息 浏览 179 12-29

坚持部署F-35B隐形战机 日本二战后首次拥有舰载战机

环球网资讯 浏览 7968 08-09

特朗普与拜登,普京选择了拜登,我们喜欢谁?

浏览 7735 07-14

打通机器人产业全链条,粤港澳大湾区应用场景创新中心揭牌

南方都市报 浏览 1522 07-13

官宣!公募“绩优生”翟相栋,离任!

券商中国 浏览 5569 08-10

年度最嚣张女配:只给自己磨皮,却被观众偏爱

Yuki女人故事 浏览 132 11-22

将人分为"安卓人"和"苹果人" 网红户晨风账号全网封禁

扬子晚报 浏览 314 10-02

塔吉克斯坦媒体:北京直飞杜尚别首条航线开通

参考消息 浏览 8179 06-18

今年“618”具身机器人销售额增长17倍!京东发布智能机器人产业加速计划

红星资本局 浏览 9189 08-10

顶流复工,已判若两人

她刊 浏览 32 04-22

美国首次购房人数创历史新低

国际金融报 浏览 3029 07-15

海盗船新键盘内嵌直播控制台,1月29日开卖!

IT之家 浏览 184 01-07

50+女人别穿得“老气横秋”!掌握3个穿搭密码,减龄还显贵

静儿时尚达人 浏览 186 11-26

都体:诺丁汉森林希望租借+有条件买断,D-路易斯已接受五年合同

直播吧 浏览 2595 08-07

计划于6月8日首航 川航再添一架熊猫涂装A350飞机

封面新闻 浏览 4019 06-06

阿维塔求变:抱紧华为、告别个性走向大众

经济观察报 浏览 210 11-25

存在局部泡沫化?国泰海通:总体未过热,还能创新高

金石随笔 浏览 393 09-01

章子怡晒照为女儿醒醒庆生!

韩小娱 浏览 116 12-29

王天辰十年蛰伏终获认可 双剧同播展演技高光

老王的视角 浏览 125 03-02

经济上行期是什么样子的?

智谷趋势 浏览 1557 07-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11