关闭广告

OpenAI开源!性能超DeepSeek 但"幻觉"频发

网易科技报道2025-08-06 12:00:025343人阅读

8月6日消息,周二宣布了一项重大战略转变,将免费“开源”旗下两款模型——gpt-oss-120b和gpt-oss-20b。此举被视为对等竞争对手在开源领域积极布局的直接回应。

OpenAI开源两款大模型:性能超DeepSeek,但“幻觉”频发

性能的答卷:一份喜忧参半的成绩单

OpenAI宣布,这两款模型将上线人工智能软件托管平台Hugging Face。它们可以根据用户提示生成文本,但不能生成图片或视频,其核心能力在于执行编程和在线查找信息等复杂任务。据公司透露,法国电信(Orange SA)和软件公司Snowflake等企业已经对这些模型进行了测试。

根据科技媒体TechCrunch披露的技术数据,在使用外部工具的情况下,gpt-oss-120b和gpt-oss-20b在Codeforces编程测试中的得分分别为2622和2516,表现优于DeepSeek R1,但逊于自家的o3和o4-mini模型;在“人类终极考试”(HLE)基准测试中,二者的得分率分别为19%和17.3%,同样逊于o

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

XREAL启用上海浦东全球总部,明年推出首款Android XR系统AR眼镜

IT之家 浏览 265 10-29

巴基斯坦男子枪杀婚内出轨姐姐 母亲称"荣誉处决"无罪

中国新闻周刊 浏览 520 08-22

邓肯-罗宾逊:活塞让我想起大学球队 会看着康宁汉姆继续成长

直播吧 浏览 3501 07-27

男子到机场懵了:飞机提前5小时起飞

潇湘晨报 浏览 6071 07-12

李凤刚出任北京现代总经理,20 年来首次由中国本土人才代表韩方

IT之家 浏览 229 11-10

王宁又牛了,今年上半年把去年一整年的钱都赚了

节点财经 浏览 3878 07-18

美众院通过修正案 或禁止美军从中俄购买数字显示器

澎湃新闻 浏览 456 09-22

江苏村镇银行改革现罕见案例,一村行吞并三家兄弟行后改名

湘财Plus 浏览 477 08-20

强降雨致厦门机场局部围界倒塌 官方通报

新京报 浏览 8813 07-12

法尔克:水晶宫确实非常难对付,如果能保持零封就更完美了

懂球帝 浏览 192 12-21

牛弹琴:总理专机完全避开两国领空 以色列确实也怕了

现代快报 浏览 400 09-26

托尼:弗拉霍维奇薪水太高不是他的错,像他这样的禁区内杀手很少

直播吧 浏览 333 09-21

追觅预热“全球首款双机械臂洗地机器人”月底发布

IT之家 浏览 482 08-12

美公布加沙和平计划 特朗普:若哈马斯拒绝将面临被摧毁

央视新闻客户端 浏览 354 10-01

媒体:欧盟"外长"妄议九三阅兵 话说得比特朗普还过分

新民周刊 浏览 458 09-07

午评:沪指半日涨0.52% 医药股持续活跃

网易财经 浏览 5346 07-30

跨年晚会主持人状态曝光!靳梦佳被质疑整容

萌神木木 浏览 168 01-01

国防部:中国不参与任何形式的军备竞赛

环球网资讯 浏览 339 09-26

"史上最难喝"饮料原价5元一瓶 如今被炒到8900元一箱

上观新闻 浏览 8721 07-23

今年的裤子流行“穿一半”,太时髦了!

LinkFashion 浏览 9279 07-27

释永信出门有人帮穿鞋 政府宾客:我领导也没这个待遇

凤凰WEEKLY 浏览 4602 07-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11