关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017903人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

配1.5T插混/2000km续航 一汽奔腾悦意07即将上市

网易汽车 浏览 532 05-23

特朗普又改口:印巴冲突期间有7架战机被击落

环球网资讯 浏览 607 08-27

长电科技副总裁吴伯平:3D异质集成加速迈向系统级架构创新

爱集微 浏览 81 05-28

中国商飞:柬埔寨拟采购20架C909客机

每日经济新闻 浏览 434 09-11

21岁女生确诊白血病4个月后去世 曾称身上现莫名瘀青

极目新闻 浏览 527 09-10

江宏杰原谅福原爱!双方为孩子和解,已放下仇恨相处融洽

素素娱乐 浏览 9345 07-12

美国关税激怒印度:多个团体组织示威 呼吁抵制美国货

财联社 浏览 19794 08-13

现场调查!拥有“黄金”招牌的金雅福爆雷后人去楼空,“买卖+委托”模式是否涉嫌非法吸存

华夏时报 浏览 269 01-02

上海女士悬赏上海市区一套房 寻找六代单传被拐儿子

扬子晚报 浏览 595 08-27

理想汽车9月交付超3万辆 新车理想i6将享跨年购置税补贴

北青网-北京青年报 浏览 425 10-02

通义实验室负责人周靖人成为阿里合伙人;小米澎湃 OS 全球版性能追平中国版 | 早资道

封面新闻 浏览 261 12-11

周杰伦蹭霉霉热度翻车!又被质疑崇洋媚外,近些年口碑越来越差

萌神木木 浏览 347 10-20

强生爽身粉致癌案新进展:被判赔单一原告近70亿元

红星新闻 浏览 476 10-09

想当科技“鲲鹏”,何小鹏学会张弛有度

禾颜阅车 浏览 3627 07-07

小鹏汽车正式登陆卡塔尔 多款产品亮相

网易汽车 浏览 276 12-29

别再焦虑了!你可能根本不是"骨盆前倾"

科普中国网 浏览 3204 06-03

铜价历史新高推动“复合集流体”量产提速,易开盖龙头“英联股份”能否成为跨界黑马?

时代周报 浏览 310 12-12

23岁美国女孩寻中国亲生父母 志愿者找到当年的孤儿院

封面新闻 浏览 311 10-29

大动作调仓!机构开年疯狂扫货这些板块,而火爆的芯片、半导体ETF竟被抛售

每经牛眼 浏览 319 01-11

周定洋社媒庆祝绝平申花:让我们继续拼、继续冲,一场一场来!

直播吧 浏览 404 09-22

卡塔尔、科威特和巴林宣布重新开放领空

上观新闻 浏览 8148 06-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11