关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017902人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

减持计划数量倍增!本月来已近130家公司公告

财联社 浏览 445 09-09

1-0击败阿根廷,力压巴西排名南美第二!这厄瓜多尔为何这么猛?

直播吧 浏览 428 09-11

科幻神作首度来袭,苏州跨年放映今日开票!

幕味儿 浏览 198 12-05

陈道明主演!36集谍战剧来袭,是《沉默的荣耀》后我唯一想追的剧

娱乐圈笔娱君 浏览 302 10-22

美媒:杨瀚森展现出身体和技术的结合 让人想到约基奇申京大小加

直播吧 浏览 4405 07-18

太癫了,又一个国民女神翻车了

独立鱼 浏览 297 10-12

岸田辞职背后:日本政坛的深层博弈

浏览 9865 07-14

黄杨钿甜星图被毁 戴假货没人找她代言

汉史趣闻 浏览 3112 07-17

“赦免”M-,梁汝波暂缓“去肥”?

字母榜 浏览 4428 07-24

李斌彻底豁出去了

华尔街见闻官方 浏览 494 08-24

和宋祖儿恋情谣言澄清后,刘宇宁口碑意外反转

喜欢历史的阿繁 浏览 145 04-29

武汉网警破获通过 “AI 换脸”非法侵入计算机信息系统案

IT之家 浏览 409 09-20

萨莫拉诺:巴萨必须引导好亚马尔,从没听过梅西说皇马偷窃

懂球帝 浏览 301 11-06

中美经贸会谈在瑞典斯德哥尔摩举行

新华社 浏览 1156 07-30

中国科学家揭秘“衰老时间表”

大象新闻 浏览 2468 07-26

联合国:希望俄乌谈判能达成"无条件停火"

北青网-北京青年报 浏览 8103 06-04

追觅科技CEO俞浩发声:怼人的员工早就提出离职,我有肚量,不会在意

红星新闻 浏览 289 01-18

队报:拉比奥特对马赛出售他的决定困惑,许多队友也感到不解

直播吧 浏览 515 08-20

美财政部制裁19个东南亚电诈实体

环球网资讯 浏览 422 09-10

2026款海狮06EV开启交付 成为全国首批上市闪充纯电车型

太平洋汽车 浏览 203 03-17

朝鲜半岛局势紧张:美韩行动引发担忧

浏览 4470 07-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11