关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017906人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

牛市来了?

智本社 浏览 8525 07-30

李昊:扑救就是一个小部分,最重要的是大家整体的防守

懂球帝 浏览 398 09-10

巴铁邀请中方分享胜利果实一起拆印度导弹 印度"破防"

空天力量 浏览 3491 07-22

男子带1650个苹果到烈士陵园:想让每名烈士都能吃5个

极目新闻 浏览 349 10-26

杜兰特与球迷合影&依旧气质独特 后面疑似乌度卡

直播吧 浏览 496 08-19

BaaS方案售20.8万起 蔚来ET5/ET5T远空套装版上市

网易汽车 浏览 275 12-19

35岁李心艾官宣产女,进手术室前哭成泪人,老公贴心安慰

扒虾侃娱 浏览 3266 08-06

跨境网赌大佬佘智江将被引渡回中国 被指曾参与KK投资

红星新闻 浏览 317 11-12

十问上汽奥迪A5L:智能化之下油车不死的自证

网易汽车 浏览 734 08-06

“湖北首富”难当?

野马财经 浏览 2173 07-29

特朗普签署行政令放宽商业航天管制

新华社 浏览 499 08-15

Altman放话:2028年,超级智能将超越人类

钛媒体APP 浏览 237 02-24

扫街榜百日奇袭:高德正在成为AI时代的超级枢纽

光子星球 浏览 304 01-08

中国车企全球突围:比亚迪前四月海外销量增长110%

新汽车志 浏览 647 05-20

F1阿塞拜疆站:维斯塔潘杆位夺冠 皮亚斯特里撞墙退赛

网易体育 浏览 392 09-22

51岁卡纳瓦罗报名竞聘国足主帅 曾在广州和天津执教

天津广播 浏览 449 09-10

被指“8元物业费却现多处烟头”,实探绿城晓风印月:口碑销售夹击下的“灰色时刻”

华夏时报 浏览 418 09-21

湖北襄阳网警:一男子发布诋毁九三阅兵言论被拘留

界面新闻 浏览 438 09-06

今年春天最流行的4件卫衣,照着穿就很好看

LinkFashion 浏览 238 03-01

动力升级 尺寸加长 吉利全新帝豪申报信息公布

网易汽车 浏览 438 09-11

山东舰航母编队香港开放活动已吸引近两万人次参观

环球网资讯 浏览 9461 07-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11