关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025166人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

国羽包揽韩国公开赛混双冠亚军

体坛周报 浏览 120 09-29

普通人冬天就该这么穿,衣服不昂贵、搭配不老气,简单又日常

静儿时尚达人 浏览 19 11-30

印度迎来最重要的一位客人

牛弹琴 浏览 17 12-05

WAIC 2025: 斑马智行元神AI大模型,获全球机构测评第一

雷峰网 浏览 2578 07-28

美国仿制伊朗的自杀式无人机 开始在中东部署

红星新闻 浏览 17 12-05

新能源购置税免征时代,正在结束

盖世汽车 浏览 82 10-25

东方甄选否认前CEO孙东旭离职;阿里巴巴重新归纳4大部门丨邦早报

创业邦 浏览 247 08-23

西班牙"硬刚"以色列:呼吁全球对以禁赛 取消武器合同

澎湃新闻 浏览 212 09-17

Windows 10,即将“停服”

第一财经资讯 浏览 106 10-13

美印贸易战升级:特朗普以“进口俄油”为由翻倍上调印度关税

财联社 浏览 3407 08-07

缅甸果敢徐发启犯罪集团案择期宣判

环球网资讯 浏览 178 09-20

尹锡悦一周内两次拒捕 韩特检组拿他没办法:怕他受伤

上游新闻 浏览 3196 08-09

今年冬天最火搭配:毛衣+毛衣,放松穿更好看!

LinkFashion 浏览 25 11-27

队报:德泽尔比觉得被拉比奥特背叛考虑让球员走人,马赛高层支持

直播吧 浏览 279 08-20

魅族 22 手机推送 Flyme 12.3.1.3A 稳定版更新

IT之家 浏览 43 11-08

西安将全面暂停网约车“一口价”“特惠单” 官方回应:属实,正督促平台落实

看看新闻Knews 浏览 257 08-20

释延鲁十年前曾举报释永信 如今武校账号开启防打扰

凤凰网财经 浏览 5990 07-31

首搭3块图灵AI芯片 小鹏G7预售23.58万元

网易汽车 浏览 269 06-13

选秀领域著名专家!选秀专家Givony和ESPN分道扬镳

直播吧 浏览 6252 07-25

鹿岛队友重聚,日本队官推晒塞尔吉尼奥与相马勇纪合影

懂球帝 浏览 4653 07-13

美国恼羞成怒 肯尼亚总统:管他呢 必须跟中国好

澎湃新闻 浏览 8206 08-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11