关闭广告

互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议

南方都市报2025-07-29 12:00:018228人阅读

7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有专家指出,互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识,要建设新的高质量数据集,应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。


论坛现场

对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其上游产业需求大量增加。

据南都记者了解,海量、高质量的标注数据成为人工智能快速发展重要支撑的同时,该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显,如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展,数据标注行业正经历从人力密集型向知识密集型转变。从前,数据标注行业对就业的带动效果

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美专家:亚洲国家被课税40% 谁搭理鲁比奥那套中国说辞

澎湃新闻 浏览 3251 07-11

53岁立白副总裁火了 8块腹肌7%体脂率夺健美亚军

南方都市报 浏览 2369 08-24

博主:国安全主力出征青岛,新援张健智在列,何宇鹏伤缺

懂球帝 浏览 5399 07-21

徐正源:全队拼了120分钟都很想赢但很遗憾 想跟所有人说声对不起

直播吧 浏览 437 08-20

尹锡悦囚室无床无空调 第一天菜单披露:蒸土豆辣白菜

上游新闻 浏览 6643 07-11

50+女人秋冬穿衣避坑指南:衣不紧身、不花哨,这样穿更高级

静儿时尚达人 浏览 200 11-24

世纪大和解?奥尼尔现场观战霍华德:我没有讨厌你只是激励你!

直播吧 浏览 473 08-19

文图拉:那不勒斯有望开启一个王朝;俱乐部正在全力支持孔蒂

懂球帝 浏览 1764 07-13

媒体:紧盯中国登月节点 NASA又急了

澎湃新闻 浏览 5738 08-07

天文学家观测到真实“星球大战”

上观新闻 浏览 4111 05-28

网红泰国商场直播带货被查 现场画面流出

大象新闻 浏览 8987 06-15

结束巡回赛9连败!布云朝克特横扫晋级,北美赛季迎开门红

全景体育V 浏览 4351 07-16

女子被取消"吉林好人"候选资格 事迹写"炒菜多放辣椒"

扬子晚报 浏览 3030 08-13

白宫又爆丑闻:为特朗普老婆拍片烧7500万

你得漂亮 浏览 179 01-28

王兴兴:对具身智能VLA架构持怀疑态度

网易科技报道 浏览 7416 08-10

智元新增人形机器人生产订单超万台,具身本体路线还能卷多久? | 独家

钛媒体APP 浏览 12 04-29

硅谷又一个“活久见”:马斯克竟曾邀请扎克伯格参与收购OpenAI

财联社 浏览 431 08-23

李小璐二胎风波!和贾乃亮复婚传闻真相大白?

说历史的老牢 浏览 6555 07-10

特朗普政府38页"重建加沙"计划披露:将建成旅游胜地

红星新闻 浏览 495 09-02

王希季院士104岁生日之际设立教育基金

看看新闻Knews 浏览 5935 07-27

股价连跌6天,但泡泡玛特却在全球狂飙!

正解局 浏览 253 10-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11