关闭广告

互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议

南方都市报2025-07-29 12:00:018036人阅读

7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有专家指出,互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识,要建设新的高质量数据集,应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。


论坛现场

对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其上游产业需求大量增加。

据南都记者了解,海量、高质量的标注数据成为人工智能快速发展重要支撑的同时,该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显,如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展,数据标注行业正经历从人力密集型向知识密集型转变。从前,数据标注行业对就业的带动效果

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

周继红被聘为国家跳水队总教练

新京报 浏览 2106 06-21

近4000人离职!NASA减员目标仍未达成

网易科技报道 浏览 2178 07-28

退600万应援,朱一龙用120亿票房证明,顶流可以不“营业”

娱乐白名单 浏览 249 08-18

官方:帕拉迪诺成为亚特兰大新主帅,签约至2027年6月

懂球帝 浏览 51 11-12

世界大战没打起来,原因都在中国!

浏览 1945 07-14

上市公司半年报出炉 A股全市场近六成公司营收正增长

极目新闻 浏览 175 09-03

美俄日宇航员前往国际空间站

参考消息 浏览 5607 08-03

智能眼镜领头羊,道出行业泡沫

虎嗅APP 浏览 9398 07-26

‌收手吧吴镇宇,63岁翻拍《生化危机》擦边卖肉,晚节保得住吗

靠谱电影君 浏览 298 08-12

涨工资,落地!

国是直通车 浏览 81 10-26

尚纬股份拟募资11.44亿元“补血”,新控股股东全额包揽

红星资本局 浏览 1980 07-18

女子买"载重3吨"电三轮改摩旅房车 发现载重仅200公斤

大风新闻 浏览 315 08-26

500亿「亲家团」撑腰,八马茶业冲刺港股

节点财经 浏览 2732 07-25

小米手机新旗舰通过SRRC无线电核准:支持UWB技术,预计17 Ultra

IT之家 浏览 174 09-20

社区盾10个点球只进5个,今日门将扑点更容易了?

体坛周报 浏览 2905 08-12

詹姆斯INS晒名人堂夹克 浓眉现身评论区:精英!

直播吧 浏览 182 09-09

特斯拉终于用上了国产大模型!豆包和DeepSeek上车

车东西 浏览 267 08-23

知名博主官宣离婚 热搜爆了!很多人看完长文落泪

极目新闻 浏览 8497 08-07

马景涛女友称不在乎26岁年龄差,“硬刚”前任?

文娱没有圈 浏览 247 08-19

阿斯:马竞青训前锋马丁今夏将离队,多家西甲俱乐部有意引进

懂球帝 浏览 7908 08-07

不是什么脸,都能被叫“高级脸”

时尚COSMO 浏览 201 09-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11