数据堂—2,657小时普通话自然对话手机采集语音数据-logo
云市场服务保障
*请勿线下交易!90%的欺诈、纠纷、资金盗取均由线下交易导致。

商品介绍

商品亮点

10年以上数据行业经验,拥有4个超大型 数据处理基地 支持跨国、跨地区、 跨年龄多种复杂采集任务 支持3D点云、语义分割、 TTS等专业化数据标注服务 数据安全合规,数据堂符合并严格遵守欧盟数据保护条例对隐私数据保护的要求。

商品说明


数据集描述

用于2,657小时普通话自然对话手机采集语音数据 中文语音识别模型”模型的测试任务

数据集简介

2,657小时普通话自然对话手机采集语音数据由4491名发音人参与录制,以自然方式进行面对面交流,不限制话题自由发挥,领域广泛,语音自然流利,符合实际对话场景。2,657小时普通话自然对话手机采集语音数据由人工转写文本,准确率高。

数据集支持的任务

中文语音识别模型”模型的测试任务

数据集的格式和结构

数据格式

16kHz,未压缩16bit,wav,单声道

人员

约4,491人;女性占比63%

录音内容

无预制文本,录音人以自然方式进行对话,同时录制对话的内容

数据集生成的相关信息

原始数据

数据集标注

句准确率不低于98%

标注特点

标注文本内容、有效句子的起止时间点、说话人标识

标注者

数据集版权信息

版权归数据堂所有,商用数据。


售后支持范围

售后服务时间:工作日9:00-18:00(北京时间) 售后服务内容:数据服务问题咨询 售后服务热线:13051623904 售后服务邮箱:services@datatang.com

数据样例

来源描述

自行生产

已提交

本页面内容由服务商提供

使用指南

立即下载

用户评论

综合评分
--

暂无评价

数据与API
4009030002 转16266
13051623904
AI助理
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

你好,我是AI助理

可以解答问题、推荐解决方案等