开源数据集

查看更多

GPT4All是可以在消费级CPU以及NVIDIA和AMD GPU上本地运行的定制化的大型语言模型,该数据集用于训练GPT4All。
76
662
数据集
文本
379.45 MB
1
免费订阅
该数据集是一个大规模、细粒度、多样化的偏好数据集,包含64k个提示、256k个响应和380k个高质量反馈,用于训练强大的奖励模型和评论模型。数据集采样自多个源,通过GPT-4对生成的响应进行注释,以收集高质量的偏好和文本反馈。
16
475
数据集
文本
896.48 MB
1
免费订阅
2023年,Evolved codealpaca采用与WizardCoder类似但开源的方法,通过gpt-4模型增强回应,目标是促进使用新预训练模型重建wizardcoder模型,并测试evol-dataset包。新增中文指令转换,与Evol-Instruct-Code-80k-v1相比,提供更长的指令和对话。
8
384
数据集
文本
243.58 MB
1
免费订阅
本数据集汇集了大量有趣、有启发性能展示ChatGPT(或者类似的AI对话模型)能力的提示语或问题示例。
29
415
数据集
文本
75.3 KB
1
免费订阅
MNIST数据集包含70,000张28x28的黑白手写数字图片,分为60,000张训练图片和10,000张验证图片,共10个类别。每个类别有7,000张图片(训练集6,000张,测试集1,000张)。
20
414
数据集
图片
17.32 MB
1
免费订阅
问题来源于弱智吧,通过调用GPT-4对疑问句生成简洁答案,答案数据筛除了明显的拒答内容。
42
543
数据集
文本
579.57 KB
1
免费订阅
包含了23,859 份回复的机器学习与数据科学领域现状调研问卷数据集。
23
317
数据集
文本
40.59 MB
1
免费订阅
HC3数据集旨在评估ChatGPT与人类专家在问题回答上的对比。
8
413
数据集
文本
140.05 MB
1
免费订阅
热门数据产品

金融大模型语料数据集
0
数据集服务
文本
49.3 MB
2
10
标贝科技有限公司是国内领先的智能语音交互及AI数据服务方案提供商。作为一家以AI技术创新驱动的企业,标贝科技拥有业内先进的AI语音交互技术及高精度数据采标处理技术,创新打造多场景应用的语音交互方案,包括通用场景的语音合成和语音识别,以及TTS音色定制,声音复刻,情感合成和声音转换在内的语音技术产品;AI数据业务涵盖语音合成、语音识别、图像视觉、NLP、3D点云等数据服务。
0
数据集服务
音频
565.08 MB
1
1
医疗大模型预训练医疗知识数据集
0
数据集服务
文本
2.77 MB
2
0.50
标贝科技有限公司是国内智能语音交互及AI数据服务方案提供商。作为一家以AI技术创新驱动的企业,标贝科技拥有业内先进的AI语音交互技术及高精度数据采标处理技术,创新打造多场景应用的语音交互方案,包括通用场景的语音合成和语音识别,以及TTS音色定制,声音复刻,情感合成和声音转换在内的语音技术产品;AI数据业务涵盖语音合成、语音识别、图像视觉、NLP、3D点云等数据服务。
0
数据集服务
音频
2.33 GB
1
90
10,464段打电话行为视频数据包括室内场景和室外场景。数据涵盖多种场景、多种拍摄角度、多种分辨率。10,464段打电话行为视频数据可用于打电话行为检测、打电话行为识别等任务数据堂专业的人工智能数据服务提供商,面向智能安防、手机应用、智能驾驶、智能家居、智能翻译等场景提供定制化数据解决方案。包括AI数据产品、AI数据采集、AI数据标注等数据定制服务。
0
数据集服务
价格商议
中文数字串手机采集语音数据是由11,010名录音人使用普通话参与采集录制,人员性别分布均匀,覆盖18-60各个年龄段。11,010人中文数字串手机采集语音数据采集自每人朗读30句4-8位的数字串。数据堂专业的人工智能数据服务提供商,面向智能安防、手机应用、智能驾驶、智能家居、智能翻译等场景提供定制化数据解决方案。包括AI数据产品、AI数据采集、AI数据标注等数据定制服务。
0
数据集服务
价格商议
全球版IPv4地址段数据,涵盖约213万个IP段地址,覆盖236个国家和2800多个省份的归属信息,包括起始和结束IP地址、地理位置和网络运营商等。
0
数据集服务
文本
31.47 MB
1
1299
聚合数据提供的历史天气数据,覆盖2000多个城市,包括每天的最高最低温度和天气状况,适用于气候研究和环境分析。
0
数据集服务
文本
148.27 MB
2
9999
API插件接口

将用户上传的普通照片,自动去除背景,换背景,自动按照证件照各种规格要求进行裁剪。
4.78 (21条)
API
8/100次
ResumeSDK支持对40多种常见简历格式的180多个字段进行高精准解析,关键简历字段解析率超过98%。使用基于大样本数据及机器学习的建模技术,使得ResumeSDK的解析效果更加智能,同时具有更强的泛化能力,能够应对各种风格的简历文本。
4.96 (17条)
API
2/100次
【证件照制作】传入照片,接口自动按照证件规格进行剪裁、抠图、背景更换等,生成证件照片。另外提供证件照检测接口可用于检测证件照是否合格,可搭配使用。—— 我们只做精品!
5 (20条)
API
0.05/次
提供高并发高可靠的API,将PDF文档转换为Word/PPT/Excel/TXT/OFD等。转换出来的文件尽可能的保持了PDF原有格式,强化了易读性。同时支持扫描类型PDF,对图像进行OCR,还原图像中文字至Word,PPT,OFD等,还原的文字可编辑。
4.72 (6条)
API
100/1000次
精细化背景分割抠图,达到发丝级抠图效果,一键抠出人像、商品、动物、图章等,最快10分钟即可接入服务。
5 (7条)
API
18/100次
模型提供了多种语言支持。您可以在识别请求中使用本页中所示的语言代码参数指定这些语言。大多数语言代码参数与 ISO-639-1 标识符一致(特别注明的语言代码参数除外)。专注于科技,学术类翻译~
4.99 (617条)
API
免费开通,按量计费
AI绘画-AI作图-AI以文生图-AI图像生成-虚拟绘画-ai人工智能,借助全球新兴的AI技术,我们为您提供了一种随心所欲、自然流畅且高能硬核的AI作图能力。您只需简单描述,即可实现图像的创作和生成,甚至可以通过输入的图像进行再创作。我们的技术广泛应用于广告营销、媒体、出版物、游戏开发、艺术创作和摄影后期处理等各种场景。
5 (38条)
API
0.06/次
将您上传的图片转化为一篇富有情感和想象力的优质散文。无论是自然风光、城市街景,还是日常生活的瞬间,"看图写散文"都能捕捉其独特的氛围和情感,创作出个性化的文学作品。
5 (4条)
API
0.20/次
训练模型/工具

人工智能平台 PAI
面向开发者和企业的机器/深度学习工程平台,提供数据标注、模型构建/训练/部署、推理优化等AI开发全链路服务。
了解更多
ModelScope 魔搭社区
汇聚各领域最先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。
了解更多
大模型服务平台 百炼
基于通义系列大模型和三方大模型的一站式大模型服务平台,提供生成式大模型全流程应用工具和全链路训练工具。
了解更多
大数据开发治理平台 DataWorks
DataWorks基于阿里云MaxCompute、Hologres、EMR、StarRocks等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台,为用户带来智能化的数据开发和分析体验。
了解更多
云原生大数据计算服务 MaxCompute
MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库,以 Serverless 架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您可以经济并高效的分析处理海量数据。
了解更多
对象存储 OSS
对象存储 OSS(Object Storage Service)是一款海量、安全、低成本、高可靠的云存储服务,提供最高可达 99.995 % 的服务可用性。多种存储类型供选择,全面优化存储成本。
了解更多
百行云游高质量数据集点击查看
百行云游高质量数据集点击查看
合作数商展示