关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02328人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

被美围绕的一周:上课、逛家、看展

黎贝卡的异想世界 浏览 348 10-20

媒体:国产飞机出海 急不得

观察者网 浏览 433 09-15

官方:因成功保级,美因茨触发奥萨苏纳前锋贝克尔的买断条款

懂球帝 浏览 106 05-09

马筱梅面相开始变化,疲惫浮肿有孕相,提及大S子女感慨宝妈都懂

萌神木木 浏览 541 08-26

涠洲岛观光车司机威胁游客称"杀人不犯法" 被拘留7天

扬子晚报 浏览 8292 08-14

900万打水漂也要反悔,西安私募缘何放弃曲江文旅1200万股股权?

时代周报 浏览 430 09-11

3万亿狂欢背后,规模指数增速拖后腿,近两成股票ETF跌破清盘线

新经济e线 浏览 4177 07-14

媒体人:王奕博为转会愿放弃编制 但若未及时获批或将缺席新赛季

直播吧 浏览 1348 08-12

返利吸存罚30万违规揽储罚160万、行长也被警告,监管剑指花式揽储

湘财Plus 浏览 6151 07-14

76岁许绍雄去世:叔公参与创立黄埔军校 姑婆是许广平

红星新闻 浏览 317 10-29

E句话| 梁小龙去世,成龙周星驰发文悼念

仙女事件簿 浏览 292 01-19

老牌柴油机龙头业绩“爆雷”:上半年净利下滑72%!出海印度受挫,核心业务又“遇冷”,年内股价已涨超80%

每日经济新闻 浏览 482 08-28

儿子车祸过世后 上海阿姨精神异常每天在小区里骂人

环球网资讯 浏览 575 08-25

第八届进博会“探营”

国际金融报 浏览 1390 07-27

衣服基础,穿法就不基础,这个变美思路确实好用

黎贝卡的异想世界 浏览 410 08-21

欧洲对美方"28点计划"逐一删改 令俄罗斯舆论颇为不满

环球网资讯 浏览 339 11-25

混动轿车标配四驱、激光雷达 技术普惠化时代来了

封面新闻 浏览 3680 07-06

男子开发顺风车抢单“外挂”软件获利200余万,被批准逮捕

澎湃新闻 浏览 551 08-12

周定洋告别成都蓉城:人生最艰难决定!在对的时间开启新挑战

奥拜尔 浏览 280 01-13

32岁中国女游客在印尼不幸溺亡 导游发声

红星新闻 浏览 5020 06-20

科瓦奇谈客战拜仁:在安联球场一味退守通常不能得到好结果

懂球帝 浏览 380 10-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11