亚马逊云科技上新：Amazon EC2 G7e实例推理性能提升2.3倍

服务商动态
2026年1月27日
0
编辑

亚马逊云科技宣布正式推出Amazon EC2 G7e实例，该实例可为生成式AI推理工作负载提供经济高效的性能，并为图形工作负载提供最高性能。G7e实例由NVIDIA RTX PRO 6000 Blackwell服务器版GPU加速，非常适合各种GPU加速的工作负载，包括空间计算和科学计算工作负载。与G6e实例相比，G7e实例的推理性能最高可提升2.3倍。

亚马逊云科技官网：点击直达（自即日起至2026年12月31日，免费试用由AWS Graviton2处理器驱动的Amazon EC2 t4g.small实例，每月最高可使用750小时）

与前代产品相比，Amazon EC2 G7e实例改进之处如下：

NVIDIA RTX PRO 6000 Blackwell GPU：相比Amazon EC2 G6e，Amazon EC2 G7e实例采用NVIDIA RTX PRO 6000 Blackwell Server Edition GPU，提供高达两倍的GPU显存和1.85倍的GPU显存带宽。借助Amazon EC2 G7e实例更大的GPU内存，用户可在单块GPU上以FP8精度运行参数规模高达700亿的中等规模模型。
NVIDIA GPUDirect P2P：对于单块GPU内存无法承载的模型，用户可将模型或计算任务拆分至多块GPU并行处理。G7e实例支持借助NVIDIA GPUDirect P2P技术，通过PCIe互连实现GPU间的直接通信，从而有效降低多GPU工作负载的延迟。这些实例还能在同一PCIe交换机下实现极低的GPU对等通信延迟。此外，与G6e实例搭载的L40s GPU相比，G7e实例的GPU间带宽最高可提升4倍，大幅增强了多GPU工作负载性能。这些优化支持用户在单节点内跨多个GPU运行大模型推理任务，并且这些GPU提供的GPU内存总容量可高达768GB。
网络方面：Amazon EC2 G7e实例的网络带宽是Amazon EC2 G6e实例的4倍，可满足小规模多节点工作负载的运行需求。同时，多GPU配置的Amazon EC2 G7e实例支持基于Amazon EFA实现NVIDIA GPUDirect远程直接内存访问（RDMA），有效降低多节点工作负载中远程GPU间通信的延迟。Amazon EC2 G7e实例还支持结合Amazon FSx for Lustre实现NVIDIA GPUDirectStorage，与Amazon EC2 G6e实例相比，实例吞吐量最高可提升至1.2Tbps，助力用户更快加载模型。

Amazon EC2 G7e实例最多配备8个NVIDIA RTX PRO 6000 Blackwell服务器版GPU，总GPU显存最高可达768GB（每个GPU 96GB显存），并搭载Intel Emerald Rapids处理器。它们还支持最多192个虚拟CPU、最高1600 Gbps的网络带宽、最高2048 GiB的系统内存以及最高15.2TB的本地NVMe SSD存储。具体参数如下：

Amazon EC2 G7e实例

Amazon EC2 G7e 实例目前已在美国东部（弗吉尼亚北部）和美国东部（俄亥俄） AWS区域推出。

Amazon EC2 亚马逊云科技

服务商动态

宝塔面板11.5.0版本现已正式发布

2026-1-23 17:45:35

服务商动态

阿里云千问旗舰推理模型Qwen3-Max-Thinking全新上架

2026-1-28 13:09:37

相关推荐

TOP1

狗云香港物理服务器方案配置和购买建议指南
23小时前
TOP2

华为云Flexus云服务器L实例适合哪些业务配置价格和购买建议
23小时前
TOP3

恒创科技大带宽云服务器适合哪些业务配置、带宽和购买建议
23小时前
野草云美国VPS适合外贸站和AI工具吗
2026年6月30日
免备案香港服务器选莱卡云CN2 GIA合适吗
2026年6月30日
UCloud静态住宅IP云主机怎么选
2026年6月30日