亚马逊云科技宣布正式推出Amazon EC2 G7e实例,该实例可为生成式AI推理工作负载提供经济高效的性能,并为图形工作负载提供最高性能。G7e实例由NVIDIA RTX PRO 6000 Blackwell服务器版GPU加速,非常适合各种GPU加速的工作负载,包括空间计算和科学计算工作负载。与G6e实例相比,G7e实例的推理性能最高可提升2.3倍。
亚马逊云科技官网:点击直达(自即日起至2026年12月31日,免费试用由AWS Graviton2处理器驱动的Amazon EC2 t4g.small实例,每月最高可使用750小时)
与前代产品相比,Amazon EC2 G7e实例改进之处如下:
- NVIDIA RTX PRO 6000 Blackwell GPU:相比Amazon EC2 G6e,Amazon EC2 G7e实例采用NVIDIA RTX PRO 6000 Blackwell Server Edition GPU,提供高达两倍的GPU显存和1.85倍的GPU显存带宽。借助Amazon EC2 G7e实例更大的GPU内存,用户可在单块GPU上以FP8精度运行参数规模高达700亿的中等规模模型。
- NVIDIA GPUDirect P2P:对于单块GPU内存无法承载的模型,用户可将模型或计算任务拆分至多块GPU并行处理。G7e实例支持借助NVIDIA GPUDirect P2P技术,通过PCIe互连实现GPU间的直接通信,从而有效降低多GPU工作负载的延迟。这些实例还能在同一PCIe交换机下实现极低的GPU对等通信延迟。此外,与G6e实例搭载的L40s GPU相比,G7e实例的GPU间带宽最高可提升4倍,大幅增强了多GPU工作负载性能。这些优化支持用户在单节点内跨多个GPU运行大模型推理任务,并且这些GPU提供的GPU内存总容量可高达768GB。
- 网络方面:Amazon EC2 G7e实例的网络带宽是Amazon EC2 G6e实例的4倍,可满足小规模多节点工作负载的运行需求。同时,多GPU配置的Amazon EC2 G7e实例支持基于Amazon EFA实现NVIDIA GPUDirect远程直接内存访问(RDMA),有效降低多节点工作负载中远程GPU间通信的延迟。Amazon EC2 G7e实例还支持结合Amazon FSx for Lustre实现NVIDIA GPUDirectStorage,与Amazon EC2 G6e实例相比,实例吞吐量最高可提升至1.2Tbps,助力用户更快加载模型。
Amazon EC2 G7e实例最多配备8个NVIDIA RTX PRO 6000 Blackwell服务器版GPU,总GPU显存最高可达768GB(每个GPU 96GB显存),并搭载Intel Emerald Rapids处理器。它们还支持最多192个虚拟CPU、最高1600 Gbps的网络带宽、最高2048 GiB的系统内存以及最高15.2TB的本地NVMe SSD存储。具体参数如下:

Amazon EC2 G7e 实例目前已在美国东部(弗吉尼亚北部)和美国东部(俄亥俄) AWS区域推出。










































