参考指南

7月28日，2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上，多位专家围绕大模型时代的数据治理与伦理建设，共商人工智能健康发展路径。有专家指出，互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识，要建设新的高质量数据集，应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。

论坛现场

对未处理的初级数据，比如语音、图像、文本、视频等进行加工处理，进而转换为机器可识别信息的过程，通常被称为数据标注。近年来，随着人工智能技术发展，数据标注成为大模型训练的必要环节，其上游产业需求大量增加。

据南都记者了解，海量、高质量的标注数据成为人工智能快速发展重要支撑的同时，该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显，如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展，数据标注行业正经历从人力密集型向知识密集型转变。从前，数据标注行业对就业的带动效果

互联网数据“耗尽”后，高质量训练数据从哪里获得？专家热议

大国放大招，...

650km续...

地表温度高达...

瑞幸咖啡，没...

毕业于北大的...

背背佳翻红背...

睡觉打呼噜要及时治疗？

谷歌：我们暂不生产平板电脑、智能戒指、小折叠手机、智能眼镜

女子1天接五六通催收电话崩溃:欠钱的是不熟的前同事

星舰第十次试飞成功马斯克发文：干得好

2026款深蓝L07上市，为15万元级唯一全系标配华为乾崑智驾的轿车

马斯克AI聊天机器人被曝仇恨与淫秽言论欧盟如罚款，总额可达X公司全球年收入的6%

2208亿，武汉85后赢麻了

火了100年，“小香风”依然是最有态度的那件衣服

李佳航、印小天拍短剧？还是穿越题材

“烟管裤”今年冬天爆火，怎么搭都时髦！

夜校开＂恋爱技巧课＂95后女生当老师学生边吐槽边学习

警惕视力小偷，多多目浴阳光！

东体：河南队开出500万元的足协杯夺冠奖金，为队史最高奖金

谷歌Pixel 10系列价格曝光：799美元起，Pro Fold最贵2149美元

8折起拍0人报名！廊坊银行1.67亿股拍卖遇冷，中小银行股权不香？

收手吧何润东！不要再侮辱观众眼睛

卡萨诺：阿莱格里跟魔笛会相处融洽，尽管他当初弃用过皮尔洛

扣非净利润暴跌944.18%！光学巨头欧菲光上半年再度亏损

空间实用/补能高效吉利蓝气球限时钜惠价3.99万元起

卖爆了！谁在“抄底”深圳

许利民暴怒狂批11分钟：输的是人是尊严再这样季后赛都进不去

男生遭老师按地上强制要求剪头发被老师勒脖子骑身上

39集《沉默的荣耀》大结局前瞻，5人再无反转，黎晴成唯一变数

＂张云龙＂被指认：已诱骗至少4人到柬埔寨同一电诈园区