关闭广告

商汤科技发布万字长文:多模态是通往AGI必经之路

网易科技报道2025-08-13 12:00:017666人阅读

本文信息:作者为科技联合创始人、执行董事、首席科学家林达华,题目为《迈向多通用智能:商汤的思考》。以下为正文:

AI 是一场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。我们认为,多模态是从 LLM 到 AGI 的必经之路。

围绕多模态,从智能演进、学习范式、数据和模型架构都面临诸多挑战,也有很大的创新空间;在组织和战略层面也有很多值得思考的问题。在本文中,我先整体回顾一下商汤的多模态之路,然后就其中的关键问题谈一下我们的思考。

1、商汤多模态之路概览

商汤是从计算机视觉技术出发,在人工智能变革浪潮中发展起来的企业。在发展之初,商汤基于深度学习在视觉领域的运用,在人脸识别、画质处理、智能驾驶等多个应用方向突破了工业红线,推动了 AI 技术在行业的落地应用。

早在2019年,商汤就基于自身的技术判断,开始在视觉模型上进行尺度定律的探索,在业内率先推出百亿参数的视觉大模型,在视觉识别上突破了多项性能纪录。这一前瞻性的技术观察,也是推动商汤较早就进行大规模 AI 算力投入的重要原因。

2022年底,OpenAI 推出 ChatGPT,掀起了全球范围的大模型浪潮,AI 进入了2.0时代。对于商汤来说,这是一次重要的机遇。我们当时开始思考,当视觉模型和语言模型在尺度定律上相会,会给我们带来什么?

在2023年3月,商汤和上海人工智能实验室合作研发,推出了我国首个多模态通用大模型“书生2.5” 并开源。这个30亿参数的大模型刷新了包括 ImageNet 和 COCO 在内的多个视觉任务的纪录,并且初步展示了通用图文问答能力。在6个月之后,Open

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《四喜》的妈圈生存指南:没有全福,只有幸存

仙女事件簿 浏览 36 11-12

芦哲:跨越百年的产能调整经验——如何从失衡到再平衡

首席经济学家论坛 浏览 3929 08-07

父子除夕夜放烟花引火灾致1死1伤 父亲被判7年赔270万

红星新闻 浏览 308 08-27

快讯|赤兔推理引擎官宣适配智谱GLM-4.5模型

网易科技 浏览 6482 07-31

泰代总理再表态:感谢特朗普关心 但不希望第三国介入

红星新闻 浏览 10144 07-28

泽连斯基指责中国不想促成俄乌停火 给出的理由很荒唐

第一军情 浏览 196 09-18

司乘天平上的滴滴

远川研究所 浏览 103 10-11

特朗普最想要的东西 中国转头"送"给了一个欧洲国家

南权先生 浏览 202 09-20

媒体:遭美国"羞辱"后 莫迪时隔7年再访华

上观新闻 浏览 286 08-28

一文带你了解儿童胸部肿瘤

网易健康 浏览 3276 06-03

法媒:巴黎小将康坦-恩贾恩图被招入一线队,将缺席U20世界杯

懂球帝 浏览 151 09-26

特朗普:将就美国对伊朗军事行动在白宫发表全国讲话

环球网资讯 浏览 6164 06-22

九三阅兵才数天美俄局势突变 特朗普突然翻脸对俄下手

北回归线 浏览 221 09-09

黄奕回应女儿被抵制:支持她勇敢面对

丁铗惊悚影视解说 浏览 708 08-13

刘亦菲的国籍问题,暴露了一个“小圈子”的恶俗

聚合大娱 浏览 207 09-10

vivo 韩伯啸:X300 是 X200 Pro mini 升级版

IT之家 浏览 215 09-11

暴雨致重庆一车行近90台车被淹 老板:损失高达600万

封面新闻 浏览 1003 07-10

大量中国女性私密照在外网传播 女生前任只在床上拍她

极目新闻 浏览 7053 07-27

智能驾驶“紧箍咒”来了:史上最严监管下的行业变局

极智动力 浏览 301 08-22

伊能静回应婚变4个月,强捧儿子又遭“反噬”?

林轻吟 浏览 276 08-17

保时捷设计下放15万级!星途E05效果图首曝 神似卡宴?

玩车情报 浏览 8113 07-30
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11