关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017905人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

半场战报-土耳其男篮46-32领先波兰14分 申京贡献10分6板6助

直播吧 浏览 400 09-10

陈赫在家做丹东蟹,张子萱围着老公转

观察鉴娱 浏览 6277 07-14

曝涉案俱乐部罚分不降级 国安名宿上禁足名单 苏宁名将或就此退役

我爱英超 浏览 255 01-29

信托业交上半年“考卷”:业绩分化,转型突围按下加速键

Daily每日财报 浏览 532 08-11

卫星图像首次发现:伊朗两处受损核设施有"重大活动"

澎湃新闻 浏览 260 02-02

拉脱维亚籍"九头身"裁判回成都献舞 还想带家人来旅游

极目新闻 浏览 397 09-15

人身险预定利率9月起下调!国寿、平安、太保等火速公告

国际金融报 浏览 2718 07-27

23岁澳男子巴厘岛溺亡 下葬2天前被发现心脏失踪

红星新闻 浏览 433 09-23

极氪 001 车型预计今年第四季度进行产品更新

IT之家 浏览 581 08-21

欧文:我在篮网没有话语权 在引进球员和聘请教练方面都说了不算

直播吧 浏览 8990 07-24

慢镜头:桑乔要先跟曼联探讨遣散费,之后曼联再跟尤文谈判转会费

直播吧 浏览 4462 07-14

佛山3000+病例 基孔肯雅热来袭

网易健康 浏览 1789 07-25

杨瀚森预计打完夏联归队参加亚洲杯 3大因素促使回归成为大势所趋

醉卧浮生 浏览 2089 07-12

1月29日客场对阵骑士!整个2025年詹姆斯将无法在克利夫兰打球!

直播吧 浏览 5124 08-09

一番“火力试探”后,菲律宾知道了中国的厉害

浏览 10127 07-14

中方公布重要证据后 日本防卫大臣只得改口但依然狡辩

环球时报国际 浏览 302 12-11

郭富城夫妇合体看赛马,透露三胎预产期

疯说时尚 浏览 337 10-16

1-7月份全国城镇调查失业率平均值为5.2%

财联社 浏览 520 08-15

从小鹏的“物理AI”,看中国智能化的下一步

观察者网 浏览 384 11-08

速腾"喷粉"波及宝来 车主:只能用透明胶带封住出风口

每日经济新闻 浏览 26 06-17

转战舞池,前意大利网球名将弗格尼尼斩获《与星共舞》冠军

懂球帝 浏览 329 11-04
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11