关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02338人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国手机季度出货下滑4%:华为重夺第一,小米苹果并列

观察者网 浏览 7692 07-30

韩团女爱豆和内娱男演员,BE感拉满了

伊周潮流 浏览 426 09-13

黄一鸣宣布新恋情,王思聪或成过去式

赵昉是个热血青年 浏览 209 11-25

新舟60民用搜救机在庆阳市完成科研试飞任务

金台资讯 浏览 1756 08-09

收评:市场全天冲高回落 三大指数微跌

财联社 浏览 626 08-20

理想汽车下摆臂异响补偿方案发布月余,多位车主投诉称遭区别对待

澎湃新闻 浏览 403 09-22

我秋天的第一件单品,穿十年也不过时

黎贝卡的异想世界 浏览 479 09-03

加拿大馋哭了:中国又从澳方买了油菜籽 一买就是9船

观察者网 浏览 486 09-20

小米YU7完成719万公里实测覆盖全国337个城市

三言科技 浏览 10219 07-25

欧盟称TikTok将欧洲用户数据转存中国服务器 中方回应

外交部网站 浏览 4981 07-12

冯德莱恩称欧洲愿继续与乌美合作 强调安全保障重要性

国际在线 浏览 254 12-29

美方突袭抓人 韩企工人:像"战区"一样 有人躲通风管

红星新闻 浏览 557 09-09

媒体:俄海军"去航母化"是在现实约束下走出的最优解

新民周刊 浏览 459 09-15

特朗普:乌克兰不该"挑战比自己大十倍的国家"

环球时报国际 浏览 639 08-21

退钱!湖北国资坚决撤销交易,湖南老板17亿套现计划落空

灰鸽观察室 浏览 8940 07-13

凯恩:踢塞尔维亚是一场硬仗,我们会尽可能一开始就掌控比赛

懂球帝 浏览 469 09-09

伊姐十一热推:电影《阿凡达:水之道》;电影《毕正明的证明》......

伊周潮流 浏览 266 10-08

央视主持杨澜:嫁百亿身家老公,57岁却直播卖课

冷紫葉 浏览 311 10-19

板块轮动到谁了?沪指逼近4000点,机构正大幅买入这些主题ETF

每经牛眼 浏览 398 10-26

30周年放大招!vivo Vision头显探索版东莞首发

爱集微 浏览 501 08-22

雪佛兰会退出中国市场吗?

正在说车 浏览 426 10-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11