当前位置: 首页>网络传播>传播工作

数据标注产业“起跑”带动人工智能应用加速落地

发布时间: 2025年09月15日 文章来源: 人民邮电报 authorIcon.png 文章作者: 本报记者 苏德悦

医学影像智能数据标注一体化解决方案,通过建设集数据、模型、工具、场景于一体的数据标注创新平台,实现医学影像标注工具的完全自主可控及国产化替代;

多模态数据智能标注平台建立以可控数据自驱的多模态训练数据培育新业态,加速推动技术创新,致力于打破国外在AI训练数据方面的技术垄断……

随着人工智能的加快发展,我国数据标注产业加快发展,市场规模持续扩大,一大批数据标注应用涌现出来,数据标注应用的领域加速拓展。随着人工智能产业的加速发展,数据标注服务产业已经成为推动人工智能发展的重要环节。截至上半年,我国7个数据标注基地已建设数据集524个,规模超过29PB,服务大模型163个。

数据标注产业规模不断扩大

应用场景更加广泛

数据标注在人工智能产业中占据举足轻重的地位,是连接数据资源、算法模型与实际应用场景的关键桥梁,也是建设人工智能高质量数据集的核心力量。2024年12月,国家发展改革委等四部门联合发布《关于促进数据标注产业高质量发展的实施意见》,提出引导和规范数据标注产业健康发展,为数字经济和人工智能发展提供坚实的基础和强大的动力,提出到2027年,显著提升数据标注产业的专业化、智能化水平及科技创新能力,年均复合增长率超20%,培育企业,打造创新载体,建设基地,完善产业生态,形成新格局。

随着政策的出台以及人工智能技术的推动,数据标注产业快速发展,市场规模不断扩大,应用领域更加广泛。近日,中国信息通信研究院联合中国电信集团、沈阳市数据局等多家单位共同编制《数据标注产业发展研究报告(2025)》(以下简称“报告”)。报告显示,目前,我国已建设四川成都、辽宁沈阳、安徽合肥、湖南长沙、海南海口、河北保定和山西大同7个数据标注基地,7个数据标注基地数据标注总规模达到17282TB,相当于中国国家图书馆数字资源总量的6倍左右,共引进和培育标注企业223家,标注从业人员达5.8万人,带动数据标注行业相关产值超过83亿元。

数据标注在不同行业领域的应用场景广泛且深入。在制造领域,数据标注深入到生产制造的各个环节,多维度、全方位汇聚生产过程中的关键基础数据,打造面向典型应用场景的高质量数据集,助力打造更加高效、精确、灵活的生产模式,促进制造业数字化转型升级。

在交通领域,数据标注汇聚交通领域的关键基础数据,打造面向城市交通智能调度与管理、自动驾驶、智慧停车等典型应用场景的高质量数据集,实现对城市交通的全方位、精细化管理,提高城市交通的运行效率和安全性。

在医疗领域,数据标注通过汇聚政策监管数据、医疗机构数据等关键基础数据,打造面向临床决策、医疗图像、药物研发、精准医疗等应用场景的高质量数据集,推动医学科研创新、医疗服务提升和健康管理智能化发展。

在人工智能领域,数据标注可形成一批面向人工智能产业应用的高质量训练和评测数据,为机器学习、深度学习、自然语言处理等提供有价值的训练数据,推动人工智能技术不断进步和应用场景多样化发展。

增强数据标注技术创新能力

提升数据标注行业赋能水平

人工智能产业的飞速发展对数据标注产业提出了新要求,数据标注产业的发展为人工智能注入了新动能。当前,以数据标注为代表的人工智能基础数据服务,联结上游数据来源方和下游人工智能算法研发方,其产业发展和服务水平直接影响人工智能应用效果。

报告指出,数据标注成为数据价值提升的核心驱动力。数据标注通过标准化处理和语义赋予,推动原始数据向高价值资产转化,成为释放数据要素经济潜能的关键。与此同时,数据标注成为人工智能技术应用的核心支撑。数据标注是人工智能技术从理论到实践的必经环节,为算法训练提供关键燃料,并通过行业适配推动技术向纵深发展。此外,数据标注成为数据要素与人工智能融合的加速器。数据标注作为数据要素与人工智能技术的连接器,构建起从数据采集到产业应用的完整生态闭环,驱动两者互促共生。

报告指出,数据标注产业作为人工智能发展的基石,当前呈现出高技术含量、高知识密度、高价值应用的“三高”特征,预示着其未来发展的前景广阔。同时,也应看到,数据标注产业仍然存在顶层设计尚需完善,高水平人才供不应求,技术创新能力有待提升,专业平台能力不足等问题,制约着产业生态的进一步完善。技术创新对于提高数据标注的效率、质量和准确性具有重要意义,是推动产业发展的关键驱动力。通过技术创新和应用,数据标注产业可以更好地满足人工智能发展的需要。下一步,要不断增强数据标注技术的创新能力,持续提升数据标注行业的赋能水平,积极完善数据标注生态体系,大力推动数据标注标准编制和应用,着重加大数据标注人才培养力度,切实保障数据安全可靠。

(编辑:王胜男)