关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02331人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

网友称在饭店吃饭被男子骚扰店家在旁观望 警方已介入

红星新闻 浏览 9967 08-10

新长安来了!中国长安汽车集团有限公司注册成立

红星资本局 浏览 5680 07-29

小米雷军营销翻车?纸巾盒是车规级,车机芯片却是消费级

象视汽车 浏览 9737 07-10

谷歌"AI笔记神器"NotebookLM上线视频概览

IT之家 浏览 7058 07-30

朝鲜军需工业副部长李亨先被拘留

央视新闻客户端 浏览 10535 05-27

国产豪华汽车品牌第一家:一汽红旗用户数量突破 200 万

IT之家 浏览 3819 07-18

武大通报图书馆事件调查复核情况:未发现杨某媛抄袭

新华社客户端 浏览 437 09-20

狸花猫将被拍卖抵债:500元起拍 目前已有1人报名参与

现代快报 浏览 558 08-17

英国已出动战机 在波兰上空进行巡逻

每日经济新闻 浏览 534 09-21

媒体:若辽宁舰访俄 俄罗斯人又将不惜代价要拥有航母

澎湃新闻 浏览 9630 07-14

国盾量子董事长吕品去世:上任半年多 年仅46岁

时代周报 浏览 259 12-19

法尔克:作为升班马,对阵曼联时拿到一分始终是个不错的结果

懂球帝 浏览 278 01-05

"一贯道"复辟案破获:宣称"发展成员年龄越小功德越大"

中国反邪教 浏览 460 09-09

多品牌疑"删除"张雨绮代言内容 此前其被实名举报代孕

现代快报 浏览 253 01-28

秋瓷炫于晓光晒吻照,晓光买香奈儿包宠妻

张发林 浏览 539 08-22

刘嘉玲的老公梁朝伟还能继续救她吗?

桑启红原 浏览 472 09-02

生意做不大?看看这个痛点是否解决了

创业家 浏览 554 08-23

美国“福特”号航母驶往加勒比海

上观新闻 浏览 305 11-05

港女最爱的国产单品,赢了特斯拉?

新周刊 浏览 300 11-27

《子夜归》将至,许凯演绎冷面天师无压力,田曦薇挑战女主有难度

最爱酷影视 浏览 515 08-17

官方:印尼足协聘请荷兰人兹维尔斯担任技术总监

懂球帝 浏览 456 08-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11