数据堂—377小时河南方言自然对话手机采集语音数据-logo
云市场服务保障
*请勿线下交易!90%的欺诈、纠纷、资金盗取均由线下交易导致。

商品介绍

产品亮点

10年以上数据行业经验,拥有4个超大型 数据处理基地 支持跨国、跨地区、 跨年龄多种复杂采集任务 支持3D点云、语义分割、 TTS等专业化数据标注服务 数据安全合规,数据堂符合并严格遵守欧盟数据保护条例对隐私数据保护的要求。

产品说明


数据集描述

用于377小时河南方言自然对话手机采集语音数据 河南方言语音识别模型”模型的测试任务

数据集简介

377小时河南方言自然对话手机采集语音数据由762名河南本土人进行录制,录音人覆盖多个年龄段,男女比例均衡,377小时河南方言自然对话手机采集语音数据不指定话题,无预设文本,由录音人两两组合自由交谈,可用于语音识别声学、声纹识别模型训练或算法研究。

数据集支持的任务

河南方言语音识别模型”模型的测试任务

数据集的格式和结构

数据格式

16kHz,未压缩16bit,wav,单声道

人员

约762名录音人,录音人来自河南地区,均为河南方言使用者

录音内容

不指定话题,录音人两人为一组自由交谈

数据集生成的相关信息

原始数据

数据集标注

句准确率不低于95%

标注特点

标注文本内容、有效句子的起止时间点、说话人标识

标注者

数据集版权信息

版权归数据堂所有,商用数据。

 

售后支持范围

售后服务时间:工作日9:00-18:00(北京时间) 售后服务内容:数据服务问题咨询 售后服务热线:13051623904 售后服务邮箱:services@datatang.com

数据样例

来源描述

自行生产

已提交

本页面内容由服务商提供

使用指南

立即下载

用户评论

综合评分
--

暂无评价

数据与API
4009030002 转16266
13051623904

建议您还可搭配以下商品

语音音频数据集服务
标贝科技有限公司是国内领先的智能语音交互及AI数据服务方案提供商。作为一家以AI技术创新驱动的企业,标贝科技拥有业内先进的AI语音交互技术及高精度数据采标处理技术,创新打造多场景应用的语音交互方案,包括通用场景的语音合成和语音识别,以及TTS音色定制,声音复刻,情感合成和声音转换在内的语音技术产品;AI数据业务涵盖语音合成、语音识别、图像视觉、NLP、3D点云等数据服务。
1
中文普通话成人语音数据集
标贝科技有限公司是国内智能语音交互及AI数据服务方案提供商。作为一家以AI技术创新驱动的企业,标贝科技拥有业内先进的AI语音交互技术及高精度数据采标处理技术,创新打造多场景应用的语音交互方案,包括通用场景的语音合成和语音识别,以及TTS音色定制,声音复刻,情感合成和声音转换在内的语音技术产品;AI数据业务涵盖语音合成、语音识别、图像视觉、NLP、3D点云等数据服务。
90
【聚合数据】全国行政区划代码表数据集
全国行政区划代码表,提供最新的行政区划信息,包含3053条记录,覆盖国家至区县级,适用于城乡规划、市场研究、地理信息系统开发等多种场景。
99
百行云游-医疗大模型预训练医疗知识数据集
医疗大模型预训练医疗知识数据集
0.50
【聚合数据】手机号码归属地数据集
聚合数据的“手机号码归属地-基础版”是一款提供手机号码段(前7位)对应的省市及运营商信息的数据产品,更新至2023年9月,数据量接近500,000条。
1299
百行云游-K12题库数据集
K12题库数据集,2000万,覆盖全年级全学科
0.10
【聚美智数】全球区号数据集
【区号查询 区号大全 全球区号】提供全球电话区号,支持国内与国外。适用于国内外长途电话拨打、电话号码校对等场景下。—— 我们只做精品!
78
百行云游-多领域标签-多轮对话数据集
多领域标签-多轮对话数据集
0.20
百行云游-金融大模型语料数据集
金融大模型语料数据集
10
ip地址城市版查询(永久版)私有化部署
【IP归属地查询-全球IP归属地查询-IP地址解析-IP地址位置查询】⭐通过IP地址查询IP归属地相关信息,包含省、市和运营商等信息 Java代码可以直接使用,无需请求第三方接口
1000