关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02265人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

从WAIC上爆火的功夫机器人,看到这家央企的具身智能「真功夫」

机器之心Pro 浏览 6243 07-29

国米本赛季11粒进球中4粒来自角球,身高超1.88米的球员有10位

直播吧 浏览 312 09-22

信阳师范大学就"千班万元"校庆捐款倡议致歉:考虑不周

环球网 浏览 1471 08-07

张本智和回应争议:没说过永不叫暂停 王楚钦违规换衣服但我没说

风过乡 浏览 530 08-12

尼科-帕斯:从小我的偶像就是梅西,我看了阿根廷国家队所有比赛

直播吧 浏览 484 08-12

河南:大力引进培育人工智能领域专精特新企业

经济观察报 浏览 4851 08-10

贝克汉姆:加里-内维尔曾找我为索尔福德拉投资,我知道这忙我必须帮

懂球帝 浏览 312 09-21

黄仁勋吹上了:卖给中国的好处,特朗普懂

观察者网 浏览 434 08-29

拜仁7连胜开局!德甲跨季14场不败,3战霍芬海姆全胜,凯恩戴帽

奥拜尔 浏览 399 09-21

开拓者7人上双114-95轻取篮网,阿夫迪亚18+6+5,克林根14+11

懂球帝 浏览 123 03-17

媒体:美军正在准备"中美大战" 准备工作越来越细致

枢密院十号 浏览 7059 07-09

【产业互联网周报】 WAIC开幕,中国大模型数量居全球首位;美国发布AI行动计划;阿里通义千问宣布更新旗舰版Qwen3模型;上海人工智能实验室发布超大规...

钛媒体APP 浏览 2249 07-28

詹姆斯在三个不同的十年得分皆破10000+ 前无古人后无来者

直播吧 浏览 8700 07-29

申花2战不胜!媒体人:别再奢望夺冠,足协自我削弱,亚冠无期待

奥拜尔 浏览 309 10-02

2026款长安逸动大变样,车长加长,增电动尾翼

懂车之道 浏览 439 08-25

但斌二季度美股持仓出炉!首次买入数字货币概念股!

私募排排网 浏览 5225 07-30

控制权易主后,吉峰科技高层“大换血”:董事长等8人辞职,同步提名8位董事候选人

红星资本局 浏览 408 08-21

54岁还不安分的汪峰,让内敛的二女儿承受了恶意

悠闲历史 浏览 7269 07-31

中国航空工业集团有限公司原党组书记谭瑞松被公诉

央视新闻客户端 浏览 969 08-06

《以法之名》王彧下线!许言午的报复太狠,江旭东才是罪恶的源头

娱乐圈笔娱君 浏览 3777 07-09

曾是百度第二大广告代理商,开创集团上半年净利润腰斩,称受市场需求变化影响

红星资本局 浏览 417 08-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11