关闭广告

互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议

南方都市报2025-07-29 12:00:018319人阅读

7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有专家指出,互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识,要建设新的高质量数据集,应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。


论坛现场

对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其上游产业需求大量增加。

据南都记者了解,海量、高质量的标注数据成为人工智能快速发展重要支撑的同时,该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显,如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展,数据标注行业正经历从人力密集型向知识密集型转变。从前,数据标注行业对就业的带动效果

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

菜鸟CEO万霖:长期看好电商发展,持续聚焦国际物流和科技

封面新闻 浏览 393 09-10

释永信被抓后,又一个明星发声:咎由自取

小徐讲八卦 浏览 534 08-12

FC26评分前26球员:萨拉赫91分居首,罗德里、范迪克、哈兰德90分

直播吧 浏览 353 09-10

美国专家预测美网夺冠人选:看好光头阿卡,萨巴力压丝袜!

网球之家 浏览 511 08-27

王晶暗示蔡少芬北上是对赌,《甄嬛传》非主动选择,而是走投无路

不八卦会死星人 浏览 478 08-23

东体:吴曦曾因脚踝肿胀放血缓解,医疗主管赞其“太硬了,战士”

直播吧 浏览 547 08-20

用图片来存储记忆,AI助手可以更聪明地处理长对话了

科技行者 浏览 260 02-04

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者 浏览 353 10-31

东方甄选宣布启动开放日报名,俞敏洪做东请吃饭

网易科技报道 浏览 542 08-22

联想 moto razr 60 系列手机获中国线上市场安卓小折叠销量第一

IT之家 浏览 375 10-21

缅甸飞昆明航班起落架受损滑出跑道 机场通报

界面新闻 浏览 3964 07-15

房产中介兼职送外卖:除了干中介 自己什么都不会

经济观察报 浏览 339 10-25

微软9000人大裁员:资本黑洞与3A危机

虎嗅APP 浏览 6622 07-12

曼联双核复出战切尔西!阿莫林称教皇来也不放弃343,拒谈加纳乔

罗米的曼联博客 浏览 404 09-20

越南传奇女飞行员坠亡 起飞前还在直播

极目新闻 浏览 4030 08-06

铂爵旅拍暴雷,传统照相馆危险了

无相商业趋势 浏览 6712 07-28

华为全新鸿蒙有礼活动开启,含最高 100 元随机现金红包等

IT之家 浏览 5455 07-28

奥迪·上汽的422天,一场不妥协的新豪华实验

网易汽车 浏览 3760 07-23

NBA战报:凯尔特人115-101公牛取NBA4连胜,安芬尼-西蒙斯27+3+3

懂球帝 浏览 264 01-06

提供9种颜色可选 尚界Z7或将于一季度发布

车质网 浏览 276 01-20

钱志敏承认用比特币洗钱 曾称要给投资者"三世富贵"

扬子晚报 浏览 432 10-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11