关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02335人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"和平鸽工资15元"上了热搜 鸽友:会给它们加餐

极目新闻 浏览 459 09-05

徐正源:全队拼了120分钟都很想赢但很遗憾 想跟所有人说声对不起

直播吧 浏览 523 08-20

车导的瓜没吃完 孟桐的瓜又来了 那英如何反击?

动物奇奇怪怪 浏览 444 09-19

全市场:贾沙里缺席布鲁日官方球迷活动,他只想转会到米兰

直播吧 浏览 3512 07-14

这么丑的五指鞋,会是OOTD新风向吗?

时尚COSMO 浏览 4097 07-19

乒坛排名乱了!女单前十名大洗牌,20岁小将创纪录,国乒独占6席

侃球熊弟 浏览 7172 07-14

普京会见伊朗最高领袖顾问:正密切关注伊朗局势

上观新闻 浏览 278 01-31

中美经贸会谈在瑞典斯德哥尔摩举行

新华社 浏览 1157 07-30

山东一餐饮店因蛤蟆汤视频被拟罚45万元 老板最新发声

极目新闻 浏览 3282 07-15

邮报:弗林蓬因伤预计缺席6周,将在国际比赛日后回归

懂球帝 浏览 342 10-31

我国最“不靠谱”专家,公开在央视“忽悠”人

来科点谱 浏览 293 01-16

特斯拉将在加州推出出租车服务,纯人工驾驶出租车

观察者网 浏览 6088 07-29

黄金股业绩飙升,金价跌至三周低点,该入局吗?

国际金融报 浏览 522 08-21

网约车司机询问乘客性经历被永久封号 三年后起诉平台

红星新闻 浏览 489 09-19

今晚中超天王山战!前四厮杀,蓉城能否守住榜首?国安主场守卫战

直播吧 浏览 436 09-21

复旦专家团队首次绘制出人类健康与疾病代谢组图谱,可预测数百种疾病

澎湃新闻 浏览 387 09-20

半场-利物浦1-0普雷斯顿 布拉德利破门索博斯洛伊献助攻

直播吧 浏览 7182 07-14

注射后48小时有知觉,6人重新行走!巴西科学家破解脊髓损伤难题

DeepTech深科技 浏览 270 02-05

黄奕回应女儿遭抵制出道:父亲涉毒与我们无关

小邵说剧 浏览 608 08-16

杨瀚森NBA生涯季后赛首胜:全场遭弃用躺赢 回主场后能否登场?

醉卧浮生 浏览 144 04-22

搭五代EA888发动机的大众旗舰SUV 地表最强2.0T

汽车之家 浏览 536 05-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11