新华通讯社主管
经济参考网

证券市场信息披露媒体

2025年3月18日 星期二

首页 >> 正文

数据标注产业爆发式增长风口的“冷”思考
2025-03-17 来源:经济参考网

随着人工智能技术的不断突破,特别是生成式AI大模型的迅速兴起,数据标注产业迎来了前所未有的发展契机。数据标注作为AI模型训练的关键一环,其质量高低直接关系到模型输出的准确性和可靠性。在数字经济的大潮中,数据已跃升为新的生产要素,其价值日益凸显。

为充分挖掘数据潜能,助推人工智能等新兴产业的高质量发展,2024年12月,国家发展改革委、国家数据局、财政部、人力资源社会保障部四部门联合印发了《关于促进数据标注产业高质量发展的实施意见》。该意见明确指出,要释放公共数据标注需求和挖掘企业数据标注需求,为数据标注产业的发展指明了方向。2025年2月17日,一场高规格的中国民营企业座谈会在北京召开。此次座谈会释放出诸多关键信息,强调了尊重民营经济、支持创新发展的重要性,并将高科技创新领域摆在了最核心的位置。

在一系列政策的有力推动下,我国数据标注产业呈现出蓬勃发展的良好态势。市场规模不断扩大,自动化水平显著提升,专业化趋势日益明显。同时,随着各行业数字化、智能化进程的加速推进,数据标注的应用领域也在不断拓展和深化,从传统的语音转写、图片文字识别等领域,向更高端、更复杂的场景延伸。例如,在自动驾驶、医疗影像分析、金融风险评估等前沿领域,数据标注正发挥着越来越重要的作用。

值得注意的是,在AI技术日新月异的今天,一项名为DeepSeek(深度搜索)的技术创新在全球范围内引起了广泛关注。超15家芯片厂商、200多家企业、多个手机厂商和车企,以及微软、英伟达、亚马逊等云计算巨头宣布接DeepSeek。腾讯微信也正在灰度测试接入DeepSeek,多家科技央企也正与DeepSeek探讨合作共建智能化算力中心。

DeepSeek的成功标志着中国在AI技术上的突破,这背后同样离不开数据标注在模型训练中的关键支撑,其发展也推动着数据标注在智能汽车、通信、AIGC等更多领域的应用拓展。预计到2027年,数据标注产业年均复合增长率将超过20%,产业规模将实现数倍增长。这一庞大的市场需求为数据标注产业提供了广阔的发展空间。

在全球科技竞争日趋激烈的背景下,我国作为AI大国,必须加快在数据要素确权、数据流通安全以及AI主权建设等方面的布局,以应对外部挑战,确保在AI领域的国际竞争力和话语权。具体思考如下:

完善数据要素确权机制,筑牢数据市场的基石。数据要素确权是数据标注产业健康发展的前提和基础。在数字经济时代,数据已成为至关重要的生产要素,其权属问题直接关系到数据的流通、利用和价值实现。数据因其无形性、易复制性及权属界定模糊等特性,使得数据要素的确权工作成为亟待解决的棘手问题。我国已出台了一系列法律法规,如《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等,为数据要素的确权提供了法律基础。但在实际操作中,如何界定数据的权属、如何平衡数据主体与数据使用者之间的利益关系等问题,仍需进一步深入探索和完善。

针对数据标注产业,我们应明确标注数据的权属归属和利益分配机制。标注数据作为在原始数据基础上通过人工或机器标注而产生的新数据,其权属问题需综合考虑原始数据提供方、标注服务提供方及标注数据使用方等众多利益相关者的权益。同时,我们还应加强法律法规的宣传和培训力度,提高产业界的法律意识和合规意识,确保数据要素确权工作的顺利进行。

构建数据流通安全治理体系,保障数字经济稳健发展的生命线。数据流通安全是数据标注产业乃至整个数字经济稳健发展的生命线。在数据标注过程中,涉及大量敏感信息的处理和传输,如个人隐私数据、商业机密等。一旦这些数据泄露或被恶意利用,将给个人和社会带来不可估量的损失。我国已出台了一系列数据流通安全相关的法律法规和政策文件,如《关于完善数据流通安全治理 更好促进数据要素市场化价值化的实施方案》等,为数据流通安全提供了制度保障。但在实际操作中,数据在流通过程中的安全性、完整性和可追溯性等问题,仍需我们深入探索并不断加以完善。

为加强数据流通安全,我们应建立严格的数据流通安全管理制度,明确数据提供方、数据接收方和数据流通平台等各方的责任和义务。我们还应加强数据流通安全技术的应用和创新,如采用数字水印、数据指纹、区块链等技术手段,确保数据流通过程中的安全性和可追溯性。我们还应加强与国际社会的合作与交流,共同推动全球数据流通安全治理体系的建设。

加强“主权AI”建设,提升国家核心竞争力。在全球科技竞争日益激烈的今天,AI主权建设已成为各国关注的焦点。我国作为AI大国,必须加快在AI主权建设方面的步伐,确保在AI领域的国际话语权和竞争力。针对数据标注产业,我们应建立自主安全可控的AI基础设施 ,确保关键核心技术基本实现自主控制。建设一体化中文语料库,确保AI发展符合我国价值观,构建AI全球治理话语权。我们还应加强培养人工智能底层技术领域的领军人才,加强科研创新。持续优化产业布局,推动产业集群发展。我们还应积极参与国际AI标准的制定工作,推动我国AI技术的国际化进程。通过制定和推广国际标准,提高我国AI技术的国际认可度和影响力。在AI主权建设过程中,还需注重保护个人隐私和商业秘密等敏感信息的安全,确保AI技术的合规应用和发展。

展望未来,数据标注产业在爆发式增长的风口上,既面临着前所未有的发展机遇,也需直面诸多挑战。在全球化与数字化的双重浪潮下,完善数据要素确权机制、构建数据流通安全治理体系、加强“主权AI”建设,不仅是保障数据标注产业健康发展的必由之路,更是推动我国数字经济迈向新台阶的关键举措。通过政策引导、技术创新与国际合作的多重驱动,我国数据标注产业将不断提升自身竞争力,为人工智能技术的深入应用与数字经济的蓬勃发展提供坚实支撑。我们应保持清醒的头脑,既要看到数据标注产业的广阔前景,也要深刻认识到其发展道路上的风险与挑战,以推动数据标注产业在高质量发展的道路上行稳致远。(付建龙 杜帅)

付建龙:江苏经贸职业技术学院副院长、中国法治现代化研究院特邀研究员、江苏区域现代化研究院特约研究员、江苏省青年科技工作者协会人工智能及新兴数字专业委员会主任委员

杜帅:对外经贸大学社会保障与企业金融研究中心主任

凡标注来源为“经济参考报”或“经济参考网”的所有文字、图片、音视频稿件,及电子杂志等数字媒体产品,版权均属《经济参考报》社有限责任公司,未经书面授权,不得以任何形式刊载、播放。获取授权

《经济参考报》社有限责任公司版权所有 本站所有新闻内容未经协议授权,禁止转载使用

新闻线索提供热线:010-63074375 63072334 报社地址:北京市宣武门西大街57号

JJCKB.CN 京ICP备18039543号