关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:0298人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

德利赫特:所有人都保持了良好的状态,库尼亚的表现真的很好

懂球帝 浏览 8241 07-27

知情人曝李昀锐孟子义真谈了!狗仔疑似发文内涵,太多细节藏不住

萌神木木 浏览 102 10-11

女子在酒店裸睡维修工突然闯入:睁眼发现对面站了个人

封面新闻 浏览 272 09-01

景区300元1天招10名兼职"野人":2000多名大学生报名

极目新闻 浏览 9304 08-07

明年挑战100万辆销量目标,零跑今年上半年盈利,D系列首款车型年内亮相

时代财经 浏览 240 08-19

美执法人员突袭抓捕大批韩国人包括工程师 特朗普发声

每日经济新闻 浏览 216 09-07

爱徒若热-科斯塔去世,穆里尼奥在新闻发布会上一度哽咽

直播吧 浏览 10271 08-06

特朗普回应马斯克成立新政党:“完全脱轨失控”

浏览 1447 07-14

醒醒吧! “女干部”别硬演,满屏都是“嘟嘟唇”,内娱没人了吗

娱乐圈笔娱君 浏览 5876 07-08

有消息称辛巴被相关部门带走调查 辛选集团:不属实

红星新闻 浏览 234 09-07

美国会机构:“大漂亮”税法将十年让政府赤字增加3.4万亿美元

华尔街见闻官方 浏览 9975 07-22

理想i8碰撞测试争议背后的信任危机:安全是否该成为营销道具

车林外传 浏览 9921 07-31

媒体:高市当选新首相 极端保守立场或激化与中国矛盾

环球网资讯 浏览 86 10-22

北约建"无人机墙"彻底激怒俄罗斯 俄方强硬回应

上观新闻 浏览 190 09-29

被问是否承认塔利班的阿富汗临时政府 外交部回应

环球网资讯 浏览 289 08-22

全尤文:为了筹钱引进莫利纳,尤文为小维阿的要价提高到2000万欧

直播吧 浏览 700 07-26

董璇张维伊恋爱史遭扒!从多年朋友转为爱人,男方6月晒了全家福

萌神木木 浏览 1800 07-16

小米智能门锁 4 Pro 双摄版发布,预售价 2464.15 元

IT之家 浏览 107 10-11

《将门独后》即将启动,选角众说纷纭,网传吴磊、迪丽热巴二搭

最爱酷影视 浏览 3305 07-26

巩俐的前夫是圈外高级打工人,75岁在新加坡养老

白面书誏 浏览 100 10-24

“我没参赛,骂声却没停过”,奥运冠军樊振东被网暴,饭圈太疯狂

娱乐白名单 浏览 5586 08-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11