产品亮点
短语音识别标准版可以将语音精准识别为文字,适用于手机语音输入、语音搜索、智能语音对话等场景。包含中文普通话输入法、英语、粤语、四川话、远场5个识别模型。语音合成可将文字信息转化为声音信息,适用于手机APP、儿童故事机、智能机器人等多种应用场景。
产品说明
短语音识别
录音文件时长不超过 60 秒,支持音频格式:pcm、wav、amr、m4a
音频编码要求:采样率 16000,16 bit 位深,单声道
转换命令:ffmpeg -y -i in.mp3 -acodec pcm_s16le -f s16le -ac 1 -ar 16000 out.pcm(in.mp3可以替换成大部分音视频文件)
type参数说明:en:英语,yue:粤语,chuan:四川话,yuan:普通话远场,zh-slow:普通话标准,zh-fast:普通话极速版
长语音识别
["mp3", "wav", "pcm","m4a","amr"]单声道,编码 16bits 位深,采样率 16000
按照识别结果文本长度计费:3500汉字/元,扣除相应次数,比如返回3500字,就是1元扣50次,返回350字,就是0.1元,扣除5次,
语音合成
音库试听: 0 小美(女) 1 小宇(男) 3 小遥(男) 4 小丫(女) 11啊逍(男) 12啊鹿(女) 13啊文(男)
14啊童(女) 15啊萌(女) 16啊朵(女) 17啊娇(女)
长语音识别结果获取
通过taskid,获取返回结果。查询结果每10次扣费1次(一次后付费0.02元,有资源包优先从资源包扣除)
另提供专业播音员真人录音100元/100字,详情联系客服


售后支持范围
售后服务范围为产品使用方面的技术支持,售后支持时间范围为合同期范围内