数据工厂的构成、建设模式和运营机制研究
所属分类:解决方案
上传者:wwei
文档大小:5183 K
标签: 数据工厂 高质量数据集 数据基础设施
所需积分:0分积分不够怎么办?
文档介绍:高质量数据集是人工智能大模型训练的核心“燃料”。当前,高质量数据集构建主要由人工智能企业自行完成,呈现零散化、作坊式、非标化的特点,难以满足人工智能大模型快速发展的需求。借鉴水厂、电厂等资源型基础设施的发展规律,结合国内外高质量数据集设施化生产的典型实践,提出“数据工厂”概念,将其定义为面向人工智能大模型应用、设施化规模化构建高质量数据集的生产设施。系统阐述了数据工厂由“储备车间”“生产车间”“中试车间”构成的三级架构体系,分析了数据标注企业升级、数据存储基地转型、人工智能企业延伸和技术企业创新设立四种建设模式,提出了保障模式、定制模式、电商模式和结对子模式四种运营机制,为推动高质量数据集设施化、规模化供给提供理论支撑和实践参考。
现在下载
VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。