关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02267人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

凌晨3点45 德国复仇战!赢球=晋级世界杯+种子队 首发曝光

叶青足球世界 浏览 202 11-17

百年变局之下,广汽的“破局”之道

智谷趋势 浏览 202 01-02

女子摔伤做手术右腿长了2厘米 医院被判赔13.7万上诉

大风新闻 浏览 3074 07-25

直辖市3位正厅被查 58岁政协秘书长年初刚履新

鲁中晨报 浏览 484 09-02

媒体:中东欧三国欲组队 在欧盟内部对援乌政策"掀桌"

上观新闻 浏览 258 11-03

难以置信!亏损大概70亿,网传某著名文娱界人士投资中植系惨败

火山诗话 浏览 4969 07-21

记者:AC米兰对莱奥尼失去兴趣,后卫引援目标锁定在德温特

直播吧 浏览 9825 08-11

特斯拉Model3/ModelY Standard正式发布

网易汽车 浏览 278 10-10

打平出线!中国队嗨翻了,更衣室疯狂庆祝如夺冠,对手颠球不想踢

侃球熊弟 浏览 378 09-10

威马汽车复活:计划3年IPO 5年挑战年入1200亿

红星新闻 浏览 460 09-07

锐评孙发京外卡事件:中网利益熏心还是中国网协卸磨杀驴?

网球之家 浏览 322 09-21

傅利叶全新人形机器人“Care-bot”GR-3,定义"有爱的"交互新范式

机器之心Pro 浏览 8373 08-07

全新MG4预售价7.38万 实力剑指比亚迪海豚

隔壁说车老王 浏览 416 08-18

欧洲外交官警告俄方:北约准备好击落侵犯领空俄飞机

环球网资讯 浏览 414 09-26

美防长被指单方面授权暂停对乌军援 特朗普都措手不及

上游新闻 浏览 7018 07-10

CJ连续10年场均得分20+但从未进过全明星!利拉德为老队友鸣不平

直播吧 浏览 1248 07-25

无框车门+宽体低趴 零跑Lafa5亮相慕尼黑车展

网易汽车 浏览 364 09-09

英超积分榜:阿森纳暂登顶,利物浦绝杀升第3,曼联第16

直播吧 浏览 336 08-26

花江峡谷大桥推"无绳蹦极":提供高度选择 价格1600元

极目新闻 浏览 271 10-20

韩安冉回应学历质疑,强调自己攻读硕士学位,曾透露在国外求学

扒虾侃娱 浏览 9274 07-09

媒体:中美元首年内第三次通话 释放出重大信号

环球网资讯 浏览 452 09-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11