开源数据集

查看更多

GPT4All是可以在消费级CPU以及NVIDIA和AMD GPU上本地运行的定制化的大型语言模型,该数据集用于训练GPT4All。
102
806
数据集
文本
379.45 MB
1
免费订阅
该数据集是一个大规模、细粒度、多样化的偏好数据集,包含64k个提示、256k个响应和380k个高质量反馈,用于训练强大的奖励模型和评论模型。数据集采样自多个源,通过GPT-4对生成的响应进行注释,以收集高质量的偏好和文本反馈。
18
516
数据集
文本
896.48 MB
1
免费订阅
2023年,Evolved codealpaca采用与WizardCoder类似但开源的方法,通过gpt-4模型增强回应,目标是促进使用新预训练模型重建wizardcoder模型,并测试evol-dataset包。新增中文指令转换,与Evol-Instruct-Code-80k-v1相比,提供更长的指令和对话。
12
399
数据集
文本
243.58 MB
1
免费订阅
本数据集汇集了大量有趣、有启发性能展示ChatGPT(或者类似的AI对话模型)能力的提示语或问题示例。
47
471
数据集
文本
75.3 KB
1
免费订阅
MNIST数据集包含70,000张28x28的黑白手写数字图片,分为60,000张训练图片和10,000张验证图片,共10个类别。每个类别有7,000张图片(训练集6,000张,测试集1,000张)。
27
442
数据集
图片
17.32 MB
1
免费订阅
问题来源于弱智吧,通过调用GPT-4对疑问句生成简洁答案,答案数据筛除了明显的拒答内容。
74
635
数据集
文本
579.57 KB
1
免费订阅
包含了23,859 份回复的机器学习与数据科学领域现状调研问卷数据集。
47
412
数据集
文本
40.59 MB
1
免费订阅
HC3数据集旨在评估ChatGPT与人类专家在问题回答上的对比。
11
432
数据集
文本
140.05 MB
1
免费订阅
热门数据产品

金融大模型语料数据集
0
数据集服务
文本
49.3 MB
2
10
示范区自2021年以来持续采集自动驾驶车辆运行状态数据、车载视频、路侧视频及点云、路侧感知结果数据、交通流量指标等数据资源。积累了近4年来示范区范围内的道路交通事故、违法违章行为、自动驾驶车辆运行状态等高价值数据资源,以及近1年来的道路交通事件(道路拥堵、施车辆故障、道路结冰、道路积雪等)和巡检事件数据(异常停车、施工占道、信号灯故障等)
0
数据集服务
价格商议
医疗大模型预训练医疗知识数据集
0
数据集服务
文本
2.77 MB
2
0.50
全球版IPv4地址段数据,涵盖约213万个IP段地址,覆盖236个国家和2800多个省份的归属信息,包括起始和结束IP地址、地理位置和网络运营商等。
0
数据集服务
文本
63.73 MB
2
1299
聚合数据提供的历史天气数据,覆盖2000多个城市,包括每天的最高最低温度和天气状况,适用于气候研究和环境分析。
0
数据集服务
文本
148.27 MB
2
9999
API插件接口

将用户上传的普通照片,自动去除背景,换背景,自动按照证件照各种规格要求进行裁剪。
4.78 (21条)
API
8/100次
ResumeSDK支持对40多种常见简历格式的180多个字段进行高精准解析,关键简历字段解析率超过98%。使用基于大样本数据及机器学习的建模技术,使得ResumeSDK的解析效果更加智能,同时具有更强的泛化能力,能够应对各种风格的简历文本。
4.96 (17条)
API
2/100次
【图文处理】【证件照制作】传入照片,接口自动按照证件规格进行剪裁、抠图、背景更换等,生成证件照片。另外提供证件照检测接口可用于检测证件照是否合格,可搭配使用。—— 我们只做精品!
5 (21条)
API
0.05/次
提供高并发高可靠的API,将PDF文档转换为Word/PPT/Excel/TXT/OFD等。转换出来的文件尽可能的保持了PDF原有格式,强化了易读性。同时支持扫描类型PDF,对图像进行OCR,还原图像中文字至Word,PPT,OFD等,还原的文字可编辑。
4.72 (6条)
API
100/3000次
精细化背景分割抠图,达到发丝级抠图效果,一键抠出人像、商品、动物、图章等,最快10分钟即可接入服务。
5 (7条)
API
18/100次
模型提供了多种语言支持。您可以在识别请求中使用本页中所示的语言代码参数指定这些语言。大多数语言代码参数与 ISO-639-1 标识符一致(特别注明的语言代码参数除外)。专注于科技,学术类翻译~
4.99 (618条)
API
免费开通,按量计费
AI绘画-AI作图-AI以文生图-AI图像生成-虚拟绘画-ai人工智能,借助全球新兴的AI技术,我们为您提供了一种随心所欲、自然流畅且高能硬核的AI作图能力。您只需简单描述,即可实现图像的创作和生成,甚至可以通过输入的图像进行再创作。我们的技术广泛应用于广告营销、媒体、出版物、游戏开发、艺术创作和摄影后期处理等各种场景。
5 (236条)
API
0.06/次
将您上传的图片转化为一篇富有情感和想象力的优质散文。无论是自然风光、城市街景,还是日常生活的瞬间,"看图写散文"都能捕捉其独特的氛围和情感,创作出个性化的文学作品。
5 (4条)
API
0.20/次
训练模型/工具

人工智能平台 PAI
面向开发者和企业的机器/深度学习工程平台,提供数据标注、模型构建/训练/部署、推理优化等AI开发全链路服务。
了解更多
ModelScope 魔搭社区
汇聚各领域最先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。
了解更多
大模型服务平台 百炼
基于通义系列大模型和三方大模型的一站式大模型服务平台,提供生成式大模型全流程应用工具和全链路训练工具。
了解更多
大数据开发治理平台 DataWorks
DataWorks基于阿里云MaxCompute、Hologres、EMR、StarRocks等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台,为用户带来智能化的数据开发和分析体验。
了解更多
云原生大数据计算服务 MaxCompute
MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库,以 Serverless 架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您可以经济并高效的分析处理海量数据。
了解更多
对象存储 OSS
对象存储 OSS(Object Storage Service)是一款海量、安全、低成本、高可靠的云存储服务,提供最高可达 99.995 % 的服务可用性。多种存储类型供选择,全面优化存储成本。
了解更多
百行云游高质量数据集点击查看
百行云游高质量数据集点击查看
合作数商展示

AI助理
登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问

你好,我是AI助理

可以解答问题、推荐解决方案等