成都市发展和改革委员会关于公开征集2025年成都市高质量数据集的通知

成都市发展和改革委员会关于公开征集2025年成都市高质量数据集的通知

各区(市)县数据主管部门、各有关单位:

为贯彻落实国家数据局等部门《关于印发〈“数据要素×”三年行动计划(2024—2026年)〉的通知》(国数政策〔2023〕11号)(以下简称“《行动计划》”)相关工作部署,充分发挥数据要素乘数效应,进一步强化数据供给,更好支撑数据流通和开发利用。现面向社会各界公开征集2025年成都市高质量数据集,相关事项通知如下:

成都市发展和改革委员会

一、征集内容及要求

高质量数据集是人工智能赋能新质生产力不可或缺的资源,其类型包括文本、视频、音频、图形图像、结构化数据等。高质量数据集是指经过清洗、标注等数据处理,在格式、质量等方面符合相关要求的数据集,主要包括服务大模型开发和训练的预训练集、指令微调数据集和测试集等。

(一)数据集领域

围绕聚焦《行动计划》明确的12个行业领域(工业制造、现代农业、商贸流通、交通运输、金融服务、科技创新、文化旅游、医疗健康、应急管理、气象服务、城市治理、绿色低碳)和其他重点行业领域,开展行业共性数据资源库建设,打造高质量人工智能大模型训练数据集。已建成或在建高质量数据集项目均可申报。

(二)数据集要求

1.具备一定先进性和示范性。数据集至少聚焦1个行业,汇聚跨区域、跨层级、跨机构的行业数据资源,能够支持开展人工智能大模型开发和训练,且具有不少于2个实际的业务应用场景,具备定期更新机制。

2.合规性要求。数据集持有单位应有明确的数据权属,流通和开发利用后可较为清晰地界定加工使用权、产品收益权,无产权纠纷。

3.应用性要求。数据集应具有较高价值密度,具有一定创新性、规模性,并可确保及时更新。原则上,应有不少于2个实际的已落地的应用场景,具备较强的推广价值;暂未落地的,应有较为明确的潜在应用场景。

4.安全性要求。数据集应符合国家数据安全与合规相关要求,不涉及个人隐私、商业秘密和国家秘密等。

(三)申报单位

市内注册登记、经营状态正常的企业、科研院所和行业协会等,被依法列入严重失信主体名单的单位不得申报。涉及多家单位的,可结合实际情况联合申报。

二、申报方式

我委将常态化开展高质量数据集征集工作,请申报单位按《通知》要求,填写《高质量数据集基本信息表》(模板详见附件1)和《高质量数据集汇总表》(详见附件2),并将电子版申报材料(含盖章扫描件和可编辑文档)以“单位名称+数据集名称”命名,发送至数字化推进处(邮箱:cdfgwsjj@163.com;联系人:周锐;联系方式:61886154)。第一批征集请于2025年3月1日前报送相关材料,后续新增或迭代更新的数据集可于每月20日前常态化报送。

对于征集的高质量数据集,我委将按照“成熟一个、支持一个”的原则,在产业合作对接、数据资源协调、场景应用宣传等方面给予大力支持,并择优推荐至国家数据局及省发展改革委(省数据局),争取国家及省级层面政策支持,发挥典型示范引领作用。

成都市发展和改革委员会

2025年2月17日


在线咨询

客服电话

服务热线:15281067168

微信客服

微信客服

返回顶部

在线咨询微信咨询电话咨询