语料库

构建安全合规高效的数据流通环境,促进大模型产业链上下游数据要素的合作对接,推动建设高质量语料库

语料数据

海量且高质量的文本、图像、音频、视频等多种模态语料数据

应用领域

围绕金融、交通运输、科学研究等应用领域,赋能大模型创新发展路径

合作伙伴

汇聚国内顶级专家学者和行业领军人物,打造语料数据生态

语料库特色
一一

特色标签化服务体系

以应用场景为导向,数交所构建特色标签服务体系,制定适用于通用大模型和垂类大模型的差异化推荐策略,通过特色标签化服务体系助力垂直领域供需方精准匹配。

语料数据创新流通模式

数交所组织协调多方共建项目,建立长期可持续性的运营机制,兼顾开源共享和商业化使用需求,通过数据要素价值释放为各行业企业数字化场景赋能。线上通过信息发布平台撮合交易,线下以DSM系列专题活动促进垂直领域供需方合作交流。

安全可信的数据流通环境

作为全国数据要素市场的核心枢纽,数交所牵头建设了国内首个数据交易链,利用区块链存证和智能合约等技术,配备相关规范指引,为大模型语料数据的流通交易和使用提供安全保障,促进数据的高效流通。

生态创新合作伙伴计划

数交所联合生态创新合作伙伴搭建多维度生态服务体系,为语料数据供需方提供精细化标注加工和技术支撑等服务,有效提升数据质量和交易价值,构建开放创新的生态圈。

热门语料数据
一一
开源语料库
一一

上海市公共数据开放平台

51个

数据部门

132个

数据开放机构

5373个

数据集

73个

数据应用

查看详情
生态创新合作伙伴
一一
最新活动
一一
申请合作咨询