澳鹏(Appen Ltd.)是图像、文本、语音、音频、视频等AI训练数据服务提供商,拥有业内先进的人工智能辅助数据标注平台及全球100多万名技能娴熟的众包资源,涵盖235+种语言和方言,来自170多个国家和地区。澳鹏通过可靠的训练数据,为科技、汽车、金融服务、零售、医疗和政府等行业赋能,目前已经在助力7500多个世界前沿的AI项目的研发及商业化。
被采集对象为6-12岁儿童,男女比例约为1.3:1。每名儿童录制的语料数大概在300句左右。每个音频文件统一使用“姓名_性别_年龄_语料”格式进行命名。样例文件选取了其中一个儿童的二十多条音频数据。
该数据库包含在928个会话期间记录的语音数据。928对独特的扬声器中的每一对都被记录了平均约60分钟的对话。每对演讲者最多录制14段关于不同主题的对话。为演讲者提供了每次谈话的主题。