全球超算TOP500：美国突破百亿亿次、中国笑而不语

大千世界 2022年05月30日 21:14 120 0

　　2022年5月30日，在德国汉堡举行的 ISC 2022公布了第59届的全球超算TOP500榜单，位于美国橡树岭国家实验室 (ORNL) 的新型超级计算机Frontier以绝对优势，成功超越日本的Fugaku，成为了全球最强超级计算机，同时也是全球首个真正的百亿亿次超级计算机。中国的神威·太湖之光和天河二号排名下滑至第六和第九。

　　百亿亿次超级计算机Frontier：性能最强，能效最高

　　据介绍，Frontier 在美国橡树岭国家实验室的计算设施 (OLCF) 占地 372 平方米，由 74 个 Cray EX 机柜组成，拥有 9,408 个节点，每个节点配备一个 AMD Milan “Trento” 7A53 Epyc CPU 和四个AMD Instinct MI250X GPU(GPU核心总数达到了37,632)。

　　每个节点通过 Hewlett Packard Enterprise(HPE)的 200 Gbit/秒的Slingshot-11 互连连接。

　　每个节点在 CPU 上运行 512GiB DDR4 内存，在整个节点上运行了 512GiB HMB2e(每个 GPU 128GiB)以及一致的内存。

　　[备注：1GiB=(1024*1024*1024)B=1073741824B

　　1GB(1000*1000*1000)B=1000000000B)]

　　整个Frontier 系统聚合了8730112个计算核心，9.2 PB 的内存(包括4.6 PB 的 DDR4 和 4.6 PB 的 HBM2e)，37 PB 的节点本地存储，并可访问 716 PB 的中心范围存储。

　　凭借强大的硬件配置，Frontier在 Linpack 基准测试下达到了1.102 exaflops 的峰值实测性能，是排名第二的日本Fugaku性能(442 petaflops)的两倍，比TOP500榜单上第2至8名性能的总和还要高。

　　美国橡树岭国家实验室主任Thomas Zacharia 在昨天举行的媒体预先简报会上说：“1.1 exaflops的性能，很容易四舍五入而忽视这个0.1，但这个 0.1 代表了 100 petaflops的巨大性能。”

　　此外，TOP500榜单上还列出了Frontier的理论最大峰值速度 (rPeak)，但 HPE 和美国橡树岭国家实验室及其他相关者，希望进一步的进行优化，以将Frontier的理论峰值速度提高到 2 petaflops 的项目目标。

　　在这种情况下，Linpack 得分也将得到提高(Linpack 效率也可能提高，目前仅为 65.4%)在昨天举行的媒体简报会上，Thomas Zacharia也证实了这一消息。

　　更为值得一提的是，Frontier功耗仅为21,100KW，比排名第二的Fugaku的29,899KW功耗还要更低。同时，Frontier还以每瓦 52.23 gigaflops 的极高能效比，超过了日本的 Preferred Networks MN-3 系统，在 Green500 中也位居榜首。

　　“世界上最快的超算也是最节能的，这一事实简直令人惊叹。”Thomas Zacharia说到。

　　美国优势扩大，欧洲开始崛起，中国仍有望逆袭

　　在2021年5月底公布的全球TOP500超算榜单上，美国当时仅有四个超算系统位居前十榜单，分别排在第二、第三、第六和第七的位置。当时中国的神威·太湖之光和天河2号还占据了第四和第五名。

　　但是，时隔一年，随着美国百亿亿次超算Frontier的登顶，全球超算格局发生巨变，美国在超算领域的优势扩大，在前十榜单当中也已占据了一半。

　　△2021年5月底公布的全球TOP500超算前十榜单(图源：快科技)

　　最新的全球TOP500超算前十榜单(图源：快科技)

　　在最新的全球TOP500超算前十榜单上，除了排名第一的Frontier之外，美国橡树岭国家实验室Summit 在HPL 基准测试中，以 148.8 Pflop/s 的性能排名全球第四。

　　Summit 有 4,356 个节点，每个节点包含两个具有 22 个内核的IBM Power9 CPU内核和六个NVIDIA Tesla V100 GPU，每个都具有 80 个流式多处理器 (SM)。这些节点通过 Mellanox 双轨 EDR InfiniBand 网络链接在一起。

　　位于美国加利福尼亚州劳伦斯利弗莫尔国家实验室的Sierra以94.6 Pflop/s的性能排名第 5。它的架构与Summit 非常相似。它由 4,320 个节点，每个节点两个IBM Power9 CPU 和四个 NVIDIA Tesla V100 GPU 构建而成。

　　此外，美国的超级计算机Perlmutter和Selene分别以64.6 Pflop/s和63.4 Pflop/s的性能，排名第7和第8。其中，Perlmutter基于 HPE Cray“Shasta”平台，以及一个具有基于 AMD EPYC 的节点和 1536 个 NVIDIA A100 加速节点的异构系统;Selene同样是基于AMD EPYC 处理器和NVIDIA A100节点。