关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017904人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小鹏半年营收飙涨近200亿!毛利率超特斯拉

车东西 浏览 549 08-20

这一天,35岁李沁秒了28岁陈哲远,才知李少红当年的眼光有多绝

温柔娱公子 浏览 254 10-14

欧洲媒体人:奥林匹亚科斯错失米西奇之后在关注海兰德

直播吧 浏览 1992 07-18

官方认证!湖南“第二省会”深圳,不装了

西部城市 浏览 8679 08-14

中美芯片博弈:英伟达被抽成H20芯片收入的15%,全新特供版AI芯片或将在中国销售

钛媒体APP 浏览 3283 08-12

被指在中国大陆沿海功能性灭绝 "美人鱼"现身南沙群岛

新京报 浏览 641 08-22

专访顶新便利餐饮 游仁宏:便利店的核心壁垒,是人与温度

新零售财经 浏览 345 10-13

华体科技携手华为,连签三地重卡超充项目

财闻 浏览 504 09-01

关店100家!潘多拉败走中国,营收萎缩至1%,消费者:质量太差

木禾投研 浏览 376 10-23

以色列航空计划下周起恢复所有目的地常规航班

环球网资讯 浏览 2722 06-26

“私募一哥”A股清零,大恒科技再临十字路口

每日资本论 浏览 386 10-13

8月2日徐州队VS扬州队门票即将开票 票价依然是5元/张!

直播吧 浏览 3180 07-29

雅图高新被举报后发长文反驳:谁是谁非需捋清 北交所非“垃圾箱”IPO企业非出气筒

财经下午茶 浏览 329 11-04

媒体:华盛顿一声枪响后 美英两个老人握手较劲八秒

新民周刊 浏览 142 04-29

最便宜GLS 2026款奔驰GLS经典版售96.8万

网易汽车 浏览 270 12-20

詹姆斯INS晒名人堂夹克 浓眉现身评论区:精英!

直播吧 浏览 365 09-09

春节过后,普京走了5步棋,招招绝妙

浏览 6865 07-14

为什么林心如没有被评为四大花旦?

锋哥与八卦哥 浏览 486 09-09

女子买万元钻戒签下回购协议 到期后店铺倒闭无法兑现

封面新闻 浏览 1617 07-24

将于东京车展首发 全新丰田卡罗拉官图曝光

车质网 浏览 386 10-14

美国早就被预言搞AI电力要吃紧,为何电荒这么快就来了?

BT财经 浏览 279 01-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11