关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02337人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

最高363km纯电续航 魏牌V9X远山详解

网易汽车 浏览 232 02-23

波兰总统访美 特朗普:先搞个战机编队飞越白宫

澎湃新闻 浏览 453 09-05

刷新中国航天新速度 走近“零窗口”发射背后的人

环球网资讯 浏览 10433 05-29

马斯克参投 飞行汽车 Alef 宣布半年左右开启量产

IT之家 浏览 546 06-08

对话橡鹿机器人董事长杨建成:炒菜机器人不必“具身”

北京商报 浏览 7659 08-11

中青赛:浙江U13队让二追三,两回合6-4战胜对手晋级决赛

懂球帝 浏览 485 09-01

雷军账号疑删除母校"武汉大学"的标签 引发多方猜测

潇湘晨报 浏览 1508 07-31

泽连斯基:俄武器含美中英德日韩零部件

澎湃新闻 浏览 361 10-08

苹果首款OLED MacBook Pro恐延至2027年发布

IT之家 浏览 2099 07-12

中国裁判吹罚NBA夏联历史首人:孙健与杨瀚森同框交流 成当值裁判

醉卧浮生 浏览 6306 07-13

上海都续约不起!洛夫顿喊出高年薪难续约,季后赛发挥也不行啊!

篮球资讯达人 浏览 1977 07-13

包贝尔老婆包文婧自曝,给儿子穿二手旧衣服

韩小娱 浏览 179 04-09

特斯拉第三季度财报亮点:交付创新高,能源业务强势领跑

不看车bukanche 浏览 336 10-23

年底是购车黄金期吗?看懂购置税博弈再下订不迟!

百姓评车 浏览 341 10-28

媒体:福建舰入列 中国航母实力世界第二位置毫无争议

新民周刊 浏览 304 11-08

别再买鲨鱼夹、大肠发圈了!现在流行这几款配饰,好美!

Yuki女人故事 浏览 10427 06-17

鲁比奥"插队"与王毅会面 态度180度转变后又恢复本色

博览历史 浏览 1688 07-15

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家 浏览 281 02-05

让二追三!世界女排联赛:中国女排3-2逆转德国女排取三连胜

直播吧 浏览 4710 07-13

NotebookLM能生成PPT了,还带演讲配音

量子位 浏览 3855 08-10

推荐两款顶配车型 长安启源A06购车指南

车质网 浏览 284 12-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11