关闭广告

互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议

南方都市报2025-07-29 12:00:018232人阅读

7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有专家指出,互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识,要建设新的高质量数据集,应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。


论坛现场

对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其上游产业需求大量增加。

据南都记者了解,海量、高质量的标注数据成为人工智能快速发展重要支撑的同时,该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显,如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展,数据标注行业正经历从人力密集型向知识密集型转变。从前,数据标注行业对就业的带动效果

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

搭载三缸发动机 2026款日产奇骏官图发布

车质网 浏览 1597 07-31

50岁女人衣不在多而在搭,学会穿长裤、长裙,美的优雅高级

静儿时尚达人 浏览 2098 06-10

杨兰兰风波升级 澳媒扒出华人富豪圈生活

古希腊掌管松饼的神 浏览 9769 08-10

"甘蔗姐姐"筹钱救弟终成遗憾:弟弟移植后排异感染离世

极目新闻 浏览 448 09-02

花少公开祝贺辛芷蕾第一人自称错过秦岚拥抱

勺哥乡村味道 浏览 364 09-09

刘宇宁不想硬接剧,自己拍着不开心,称有些人扑一部又一部还在拍

扒虾侃娱 浏览 218 01-08

消息称小鹏今年将推G01等4款新车,冲击55万-60万销量目标

IT之家 浏览 205 01-13

曾经历23次手术 "烧伤男孩"高考664分被东南大学录取

红星新闻 浏览 4914 07-29

养老金增速领跑 险资投资版图更新

北京商报 浏览 216 11-25

拆箱开源版Coze:Agent核心三件套大公开,48小时揽下9K Star

量子位 浏览 6797 07-28

“关税休战”延期90天,对中美贸易意味着什么?

环球网资讯 浏览 1045 08-13

惊艳亮相!歼-20S飞行员披露新变化

扬子晚报 浏览 382 09-06

《堡垒之夜》放弃日本iOS,Epic硬刚苹果指控违法

环球网资讯 浏览 196 12-19

离开妈妈黄圣依半年的安迪 在杨子照顾下邋里邋遢

老吴教育课堂 浏览 1277 07-28

李国庆谈再婚:妻子是北大"白月光" 曾要买房惹怒对方

极目新闻 浏览 491 08-19

51:44共和党临时拨款法案未获推进 政府"停摆"已两周

每日经济新闻 浏览 267 10-16

集体异动!马斯克突然宣布:免费!

券商中国 浏览 475 08-12

阿斯:皇马想延续阿拉巴和吕迪格的成功,以免签的方式签中卫

懂球帝 浏览 163 02-05

德转列药厂队史买人榜:蒂尔曼&宽萨3500万欧,希克&博尼法斯在列

直播吧 浏览 3366 07-13

价格真香了!最强安卓旗舰平板荣耀MagicPad3 Pro首销优惠价3799元起

快科技 浏览 297 10-16

胡塞武装称袭击以色列多处目标 致其“航班中断”

环球网资讯 浏览 1376 07-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11