关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02336人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上海交大+九识智能,“联合实验室”能碰撞出什么火花?

野马财经 浏览 3062 08-10

秦昊一家五口度假,伊能静少女打扮但很显胖

八怪娱 浏览 283 12-19

阿斯:卡瓦哈尔已具备首发的状态,阿诺德预计周末回归名单

懂球帝 浏览 282 02-05

非洲杯决赛裁判组:主裁来自民主刚果,VAR裁判来自加蓬

懂球帝 浏览 306 01-19

广厦总经理:再困难也要先解决俱乐部问题 布朗薪资联盟中等水平

直播吧 浏览 470 09-01

前10月规模以上高技术制造业利润同比增长8.0%

北京商报 浏览 295 11-27

"霉霉"官宣订婚:特朗普祝贺 其个人财富已达16亿美元

每日经济新闻 浏览 503 08-27

泰国代理总理发声:柬埔寨没有表现出诚意

财联社 浏览 4339 07-29

Arm 公布 C1 CPU / Mali G1 GPU 完整阵容,分别含 3 / 4 个型号

IT之家 浏览 432 09-10

北京朝阳国资13年"新房"被抢购 有人半夜就来排队

每日经济新闻 浏览 10121 07-21

美推进“金穹”系统的天基拦截器研制 但钱和技术都存在问题

澎湃新闻 浏览 340 10-12

他们才是真正的明星夫妻

石场阿鑫 浏览 393 09-06

战胜王楚钦 张本智赛后脱衣疯狂庆祝

直播吧 浏览 532 08-12

于根伟激励全队:付出最大的努力,把最后4轮比赛“咬”下来

懂球帝 浏览 375 10-16

东体:足协杯战河南后,吴曦脚背内外总共缝了五针

懂球帝 浏览 1443 07-28

平均海拔超3600米 探访建在世界屋脊上的无人机试飞场

环球网资讯 浏览 2057 07-26

继“车道级广告”后,百度地图又被曝打车还得看广告

三言科技 浏览 524 09-01

以色列又对加沙开火 内塔尼亚胡被指曾想请示特朗普

澎湃新闻 浏览 257 11-01

怎么办,得了一种看见李维嘉就想笑的病!

时尚COSMO 浏览 364 08-31

“气球裤”今年夏天火爆了,这样穿时髦松弛又减龄

LinkFashion 浏览 2328 07-15

媒体:南博获捐的137件书画中 《江南春》算不上顶级

红星新闻 浏览 289 12-21
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11