产品亮点
- 镜像预装了针对分布式人工智能训练场景的深度优化库AIACC-Training(AIACC训练加速),用于优化基于AI主流计算框架搭建的模型,能显著提升训练性能
- 预装多个版本的深度学习框架(TensorFlow/PyTorch/MXNET)和NVIDIA 运行环境,用户可开箱即用
- 支持用conda环境切换到不同的深度学习框架和CUDA环境
产品说明
神龙AI训练加速引擎AIACC-Training(AIACC训练加速)
AIACC-Training(原Ali-perseus、Perseus-Training)是阿里云神龙计算加速团队基于阿里云IaaS资源层研发和维护的高效人工智能分布式训练加速组件,旨在实现开源兼容以及无感地加速您的分布式训练任务。
- AIACC-Training支持基于AI主流计算框架(包括TensorFlow、PyTorch、MxNet和Caffe)搭建的模型进行分布式训练任务加速。
- 在接口层面上,AIACC-Training兼容了PyTorch DDP和Horovod的API,对于原生的分布式训练实现了无感的性能加速。
- 在底层加速上,针对阿里云网络基础设施和AI数据并行分布式训练的特性,AIACC-Training的优化带来了显著的性能提升。
详情请访问:https://help.aliyun.com/document_detail/198783.html
售后支持范围
售后服务范围为产品使用方面的技术支持,售后支持时间范围为合同期范围内