关闭广告

互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议

南方都市报2025-07-29 12:00:018034人阅读

7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有专家指出,互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识,要建设新的高质量数据集,应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。


论坛现场

对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其上游产业需求大量增加。

据南都记者了解,海量、高质量的标注数据成为人工智能快速发展重要支撑的同时,该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显,如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展,数据标注行业正经历从人力密集型向知识密集型转变。从前,数据标注行业对就业的带动效果

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

终结“内卷”!价格法修订直击恶性竞争核心

上观新闻 浏览 2520 07-25

075型两栖攻击舰"湖北舰"官宣亮相

扬子晚报 浏览 4224 08-02

详解德天空:杰克逊1650万欧租借 若强买触发则6500万欧+二转

直播吧 浏览 236 09-02

年薪上亿"炫富"清华学霸曾想反诉公司诽谤 被控三项罪

红星新闻 浏览 246 09-18

硬件检测软件HWiNFO更新:新增RTX 5090D v2、提前支持Intel Nova Lake

快科技 浏览 331 08-13

东方甄选官宣第二款卫生巾19日上市

网易科技报道 浏览 4718 07-17

对话千岛沈振宇:不要问我下一个Labubu是谁,我只知道它很快会来

晚点LatePost 浏览 276 08-27

追忆分子生物物理学家王大成院士:系中国蛋白质工程学开创者

南方都市报 浏览 158 09-20

三考落榜情路坎坷,巩俐凭什么成“巩皇”?张艺谋一句话道破真相

娱乐白名单 浏览 8030 07-14

连续2天逆跌,票房会破30亿?大鹏都压不住,暑期档又诞生大黑马

靠谱电影君 浏览 2160 07-24

2026款大众宝来上市 售价11.29-14.39万元

车质网 浏览 54 11-04

全球科技资本博弈:“抢人大战”盖过并购潮

蓝鲸新闻 浏览 3944 07-22

上海发布首批Robotaxi示范运营牌照,上汽获双牌照

上观新闻 浏览 4029 07-27

TVB帅气中佬组男团再出道,年龄加起来超200岁

TVB的四小花 浏览 119 10-11

收手吧安志杰,新片票房仅731万,和谢苗的差距越来越大了

靠谱电影君 浏览 2226 07-30

媒体:河南农民苦 夏天大旱中救活的玉米现在都泡烂了

南风窗 浏览 102 10-23

谁在买尊界S800?

Daily每日财报 浏览 2242 07-26

霍瑞戎履新上交所副理事长 曾任证监会国际合作司司长

21金融圈 浏览 186 09-11

销量连跌5年?洋品牌无奈关闭100家门店,专家:中国人不买了

木禾投研 浏览 193 09-01

时隔六年进决赛!国安7-0十人玉昆将战河南 法比奥破门塞鸟两助

直播吧 浏览 245 08-21

五六十岁女性想高级:衣要简、裤要松,裙过膝,老了照样优雅

静儿时尚达人 浏览 5116 07-15
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11