中国信通院李荪:高质量数据集是人工智能能力提升的核心支撑

中国信通院李荪:高质量数据集是人工智能能力提升的核心支撑

来源:雪球App,作者: 大模型大未来,(https://xueqiu.com/7718347967/348551169)

8月22日,“大模型 大未来”2025大模型应用场景交流全国行暨大模型数据要素建设行活动在天津举办,中国信息通信研究院人工智能研究所平台部副主任、中国人工智能产业发展联盟(AIIA)数据委员会主任李荪发表题为《大模型高质量数据集发展现状及建设路径》的主题演讲。

参会嘉宾李荪

人工智能每次阶段性进步,数据都扮演着重要角色。尤其在大模型时代,海量、 高质量、多样化的数据集,是拉开模型能力差距的关键要素。

随着Deepseek-R1等复杂推理模型的发布,以及“人工智能+”行动推进,又极大提高了复杂推理数据集,多模态数据集、行业数据集、具身智能数据集的需求。

高质量数据集则是人工智能能力提升的核心支撑。目前,高质量数据集覆盖制造、金融、医疗、交通、公共安全等多个重点行业的公、私域数据,具备高技术含量、高知识密度、高价值应用的“三高”特征。

在政策层面,国家部委和地方政府注重“人工智能+高质量数据集”政策协同布局;在产业层面,算法趋同、算力普惠背景下,高质量、高价值密度的数据集将构建起企业差异化竞争力。

针对企业落地难点,李荪提出“三步走”战略:体系规划阶段绘制数据资源地图;工程建设阶段以“数据工厂”模式实现规模化生产;质量监测阶段通过量化评估与动态机制实现闭环优化。此外,建议地方政府、央企及数据标注基地协同发力,加快构建“资源管理—开放共享—流通交易”三位一体的数据要素生态。

刘谧 红星新闻记者 李伟铭

相关推荐

最全汉服汇总,图文详解(女装篇)
体育投注365下载

最全汉服汇总,图文详解(女装篇)

📅 08-06 👁️ 1561
揭秘当日玄机,探寻隐藏在日常生活背后的神秘力量当日玄机报,揭秘日常生活中的隐藏力量,当日玄机报的探索之旅
联想手机a708t
体育投注365下载

联想手机a708t

📅 07-04 👁️ 6793