亚马逊云联手英伟达,推出新一代EC2 P5实例,支持生成式AI和高性能计算
网络
2023-08-07
7月30日消息,亚马逊云与英伟达携手推出全新Amazon Elastic Compute Cloud(EC2)P5实例,配备强大的英伟达H100 Tensor Core GPU。这项新服务为用户提供了扩展生成式人工智能、高性能计算(HPC)和其他应用的便利途径,只需通过浏览器就能轻松实现。
据了解,英伟达H100 GPU具有针对Transformer的优化,这是许多先进AI应用的关键技术之一。这样的优化使得H100在这些应用中表现出更卓越的性能和效率。尤其是对于开发人员和研究人员来说,每天都在不断发掘人工智能的新应用,推动这些应用走向市场需要更高的计算效率。
NVIDIA H100 GPU以其创新的架构提供超级计算级别的性能。其中包括第四代Tensor Cores,新的Transformer引擎用于加速大型语言模型 (LLMs),以及最新的NVlink技术,这些特性使得H100 GPU在处理复杂计算任务时能够显著提高性能。
据了解,EC2 P5实例特别适合用于训练和运行复杂的LLMs和计算机视觉模型的推理。这些强大的神经网络驱动着最复杂、计算密集型的生成式人工智能应用,包括问答、代码生成、视频和图像生成以及语音识别等应用场景。
尽管AWS尚未正式承诺将AMD MI300芯片集成到其云服务中,但亚马逊弹性计算云副总裁Dave Brown证实,AWS正在积极考虑采纳这一方案。这表明云计算领域正不断探索和引入新的创新技术,以满足不断增长的计算需求和更广泛的应用场景。