关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017837人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

福建舰电磁弹射技术处世界先进水平

北京日报客户端 浏览 182 11-08

时隔8年重返英超首胜,桑德兰官方晒巨幅Tifo庆祝

懂球帝 浏览 419 08-19

微信支付正式接入鸿蒙收银台

北青网-北京青年报 浏览 3841 07-24

误删微信聊天记录可以撤销了!

大象新闻 浏览 879 07-13

罗马诺:皇家奥维耶多将免签佛罗伦萨前锋布雷卡洛,Here we go!

直播吧 浏览 379 08-21

沈伯洋被指到处寻求"保护" 邱毅:"台独"分子们都慌了

环球网资讯 浏览 229 11-11

不务正业? 理想汽车发布AI眼镜 长续航还能控车

网易汽车 浏览 194 12-05

新疆女星都不抗老?迪丽热巴新剧状态像“大婶”,古力娜扎却绝美

温柔娱公子 浏览 2181 08-04

格陵兰岛称选择丹麦和欧盟 已准备好迎接更大规模军事存在

国际在线 浏览 166 01-23

反转反转再反转!让片名耽误的杰作

电影最TOP 浏览 176 01-23

女子称求职要求双休获回复"漂亮可以天天休" 平台回应

大象新闻 浏览 535 08-18

记者:罗马本周计划推进签下韦斯利,球员与红狼军团已达个人协议

直播吧 浏览 1002 07-15

阿根廷0-1收官!世预赛近7轮首败,遭点杀+0射正,双方各1人染红

我爱英超 浏览 312 09-10

张艺兴单依纯都在跳,“技能五子棋”是什么?

黔乡小姊妹 浏览 285 10-11

特朗普或为中国制造三大机遇,中国如何利用?

浏览 7188 07-14

数智时代下女性力量崛起,中国数字经济已创造5700万个女性就业岗位

上观新闻 浏览 7071 07-28

俄乌超百万规模的兵力集结 普京下令推进中方紧急预警

掌青说历史 浏览 2005 07-17

大窑汽水独家回应将被KKR收购:经营团队稳定,全国化及年轻化战略不变

红星资本局 浏览 4466 07-18

终于来了!山东签约新大外弥补内线隐患,但陈培东感冒将缺席一场

篮球资讯达人 浏览 179 01-19

菲律宾叫嚣希望中方"纠正"风险通告:曲解菲实际情况

澎湃新闻 浏览 2395 07-22

迈向智能化 广汽丰田雷凌L新老款车型对比

车质网 浏览 174 01-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11