关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02272人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

春晚主持人阵容曝光,5位都是老面孔

领略非凡 浏览 171 02-05

AI新云崛起:从Forrester2025十大云趋势看九章智算云的突围

上观新闻 浏览 348 09-11

中国人寿新增2名总裁助理,10名高管均为内部晋升

财经众议院 浏览 308 09-26

超300倍就清零!超高位科技股突然暴跌,中芯国际重挫7%

深蓝财经 浏览 302 10-11

媒体:自家老牌车企落后中美 欧盟恐对中国车厂下手

澎湃新闻 浏览 257 11-09

春季穿衣千万别太暗沉!试试蓝白配色、选基础款裤子,大方得体

静儿时尚达人 浏览 15 04-29

特朗普的亲家激怒法国政府:控告法国纵容"反犹情绪"

环球时报国际 浏览 532 08-26

张馨予医院打吊水!自曝体重降到100斤体质变差

韩小娱 浏览 167 02-02

蔡浩宇的疯狂实验,跟游戏没啥关系?

字母榜 浏览 425 08-24

官宣CBA董事长再易主,杨阳取代徐济成!联赛变革或再次提速?

君马体育 浏览 6575 07-25

泽连斯基:乌美保持全天候、多层次接触

央视新闻客户端 浏览 7592 08-10

俄罗斯一架安-24客机起飞时滑出跑道 无人员伤亡

央视新闻客户端 浏览 440 08-19

车圈圆桌派②|人工智能改变汽车产业,大模型应用仍存难点

贝壳财经 浏览 2247 07-12

前皇马中场梅德兰:美国足球人才少工作文化浓厚,沙特则恰恰相反

直播吧 浏览 9614 08-07

一财社论:国企民企协同发展大有空间

第一财经资讯 浏览 10079 08-14

苹果向 AirPods 4 / Pro 2 推送 8A5324b Beta 固件

IT之家 浏览 8972 07-30

邮报:森林和埃弗顿有意租借道路,但尤文想将其永久出售

懂球帝 浏览 2604 08-07

被重罚8700万天价,“业绩乏力”的华夏银行暴露了啥?

密探财经 浏览 350 09-09

因凡蒂诺:有球队打给FIFA问能否踢世俱杯;当然希望利物浦等队参赛

懂球帝 浏览 4749 07-13

泰它西普治疗干燥综合征中国Ⅲ期临床研究成功入选

豹变 浏览 331 09-29

露奶裙失宠了?撩人的“莫奈裙”,好看高级到爆!

Yuki女人故事 浏览 362 09-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11