关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02268人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

估值3.5亿的廊坊银行股权被拍卖偿债,持股人刚被法院悬赏

湘财Plus 浏览 184 01-18

谁懂啊!小个子冬日穿搭靠这几招,视觉立刻拔高10cm

黎贝卡的异想世界 浏览 184 12-29

小米SU7 Ultra专属销售团队“解散”

电动知家 浏览 159 02-04

罗体:那不勒斯为恩多耶开价4000万欧,博洛尼亚坚持要价4500万

直播吧 浏览 2983 07-28

普通人穿衣别太发愁,学会这些基础穿搭,舒适大方又省时间

静儿时尚达人 浏览 255 10-19

每体:拉菲尼亚伤势恢复不如预期,出战国家德比存疑

懂球帝 浏览 297 10-15

迟来的深情比草贱!具俊晔拿手机平板天天守大S墓地被说太会表演

南南说娱 浏览 9041 07-28

精耕细作、“轻”装上阵 贝壳长成居住服务“稀缺标的”

阿尔法工场 浏览 402 08-29

美防长称特朗普已下令为重振美国军队做好准备

环球时报 浏览 259 09-04

外卖商家也"照骗":平台头像AI生成 实际可能只有厨房

澎湃新闻 浏览 27731 08-10

浙商银行前三季度经营稳健,总营收489.31亿元

证券市场周刊 浏览 273 10-31

名宿:拜仁选孔帕尼,如同中了头奖

体坛周报 浏览 240 10-29

硬核风格 奥迪Q6 e-tron越野版假想图曝光

车质网 浏览 192 12-04

蔡少芬不再隐瞒!自曝老公噩耗,原来大S离世就已给明星提了个醒

八斗小先生 浏览 4709 08-13

4米画作“进口袋”、“真假人脸”秒辨别,合合信息重磅发布

南方都市报 浏览 6245 07-29

印度宣布重大消息,震惊了全世界

牛弹琴 浏览 5880 08-10

小S暂无复出计划,制作人B2曝其近状,两人私下聊天内容曝光

扒虾侃娱 浏览 3266 07-15

需求激增 流感药“新老对决”

北京商报 浏览 197 11-25

北京:大兴机场巴士环球影城快线正式开通运行

北青网-北京青年报 浏览 396 09-02

被家暴16次女子得70%共同财产及10万赔偿 共140万余元

极目新闻 浏览 277 10-25

刚刚,中国这个邻国棋行险招,动静闹得太大

浏览 8902 07-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11