关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02103人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小米SU7改配YU7 准车主后悔了:还要等41周

大象新闻 浏览 3564 07-11

美股全线下挫,科技股大跌,英伟达跌超3%,黄金涨破3340美元

21世纪经济报道 浏览 291 08-21

女婿杀岳母后人间蒸发 切断与子女亲友所有联系潜逃

都市快报橙柿互动 浏览 187 10-01

渤海银行年薪201万副行长辞任,半年前已卸任执董、目前还是高管

湘财Plus 浏览 4932 07-28

"三位一体"战略核力量首次集中展示

政知新媒体 浏览 207 09-04

于根伟:我们上半场进入状态慢了些,很遗憾输掉了比赛

懂球帝 浏览 10105 07-28

NBA加WNBA至少4夺MVP球员:一共6人 乔丹詹姆斯在列 阿贾今日入围

直播吧 浏览 152 09-22

WAIC首日速递|我们已经不可能消除AI了,但我们必须管好它

虎嗅APP 浏览 3243 07-27

卫报:曼苏尔和芬威集团的第三大股东曾成立一家联合投资公司

懂球帝 浏览 41 11-08

全新深蓝S07亮相成都车展 超豪华越级更悦己

网易汽车 浏览 206 09-02

找到亿吨“锂矿”,也得算算经济账

汽车公社 浏览 4324 07-12

内部代号泰山 岚图大型SUV路试谍照曝光

车质网 浏览 7549 07-24

马斯克推出二次元“AI女友” 使用前提是每月支付30美元

财联社 浏览 4791 07-16

始祖鸟、蔡国强就烟花秀致歉

YOUNG财经 浏览 165 09-21

图片报:世俱杯前枪手曾视帕利尼亚为目标,国米也对他感兴趣

懂球帝 浏览 1493 07-17

真有品味的中年女人,穿衣打扮都有这4个共同点,你中了吗?

静儿时尚达人 浏览 121 10-19

新车看点 | 主打性价比,东风风行星海V9越享系列不到15万元起售

观察者网 浏览 221 08-23

美媒:特朗普将关税几乎翻了一倍 摆了越南人一道

澎湃新闻 浏览 1040 07-12

日赚2.5亿,禁酒令也压不住茅台!百亿基金中,就张坤还有茅台信仰

深蓝财经 浏览 4716 08-14

11年不分红!是“铁公鸡”还是真的穷?

诗与星空 浏览 6453 08-07

不管在什么地方 你都是那样拉轰的男人

星球商业评论 浏览 83 11-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11