孟庆国:培育数据标注新业态 推动建设高质量数据集

新闻焦点 2025-09-15 06:27:58 27781

人民网深圳8月26日电 (记者栗翘楚)随着人工智能技术快速发展,孟庆高质量数据集已成为推动生成式人工智能创新发展的国培高质核心稀缺要素。

清华大学中国电子数据治理工程研究院院长孟庆国在“2025人民数据大会”发表主旨演讲。育数业态<strong>每日资讯</strong>人民网记者 翁奇羽摄

清华大学中国电子数据治理工程研究院院长孟庆国在“2025人民数据大会”发表主旨演讲。据标建设据集人民网记者 翁奇羽摄

8月26日,注新清华大学中国电子数据治理工程研究院院长孟庆国在“2025人民数据大会”发表主旨演讲时表示,推动人工智能的量数每一次发展和进步都与数据有关,没有数据的孟庆支撑,人工智能将寸步难行。国培高质在大模型时代,育数业态有没有成规模、据标建设据集高质量、注新多模态的推动数据,成为行业发展的量数基础。

高质量数据集是孟庆每日资讯什么?

孟庆国表示,高质量数据集需要具备以下要素:有一定规模、准确性高和拥有足够多样性,同时还包括数据的时效性,数据是否合规、合法,以及数据和训练模型之间的匹配程度。

数据标注作为将原始数据转化为可识别、可训练、可计算的关键环节,其质量直接决定了数据集的应用价值。培育壮大数据标注产业对于提升数据供给质量,推动人工智能创新发展具有重要支撑作用。

孟庆国表示,近年来,我国数据标注产业链发展迅速,市场规模达800多亿,但依然存在高质量行业数据规模较小、数据治理的能力不足、复合型标注人才存在缺口、数据质量的评价体系不完善等现象。

如何开展数据标注?

在国家战略布局和大模型技术突破的双重驱动下,数据标注产业正在经历从劳动密集型向知识密集型的深刻转型。孟庆国表示,从历史维度来看,过去的数据更多依赖人工,如今是以工具和平台作为标注手段,未来,依靠人工智能自身去进行数据标注将成为趋势。在做好布局和探索过程中要把握以下几方面路径:

要进行需求牵引,通过挖掘人工智能的场景,来释放标注的需求。要因地制宜,通过构建一些特色产业的场景,来发展具有特色性的数据标注产业。要夯实基础支撑,在数据质量、数据伦理、数据安全得到保障的前提下,构建数据可信的标注空间,助力数据价值释放。要打造产业聚集,通过产业聚集推动数据产业的发展。要带动就业,通过数据标注,发展具有专业领域知识的专门性标注人才。要营造良好产业生态,特别是在政策、制度、标准、公共服务平台建设等方面进一步营造好数据标注的发展环境。

(责编:杨曦、吕骞)
本文地址:http://toutiao.zp-jy.com/html/408a9399498.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

数读中国|金秋“丰”景满神州 颗粒归仓筑牢1.4万亿斤目标

支撑构建三大供应链 TCL亮相2024链博会

文本生成视频 打开哪些可能

共探开源技术的新进展 新经验 新趋势

人民币对美元汇率波动上行 短期或仍有升值空间

友情链接