超级计算机 Frontier 以每秒 9.95 万亿次计算创下新纪录
给人们一个障碍,他们一定会在某个时候冲破。查克·耶格尔(Chuck Yeager)于1947年打破了音障。尤里·加加林(Yuri Gagarin)于1961年首次载人航天进入轨道。人类基因组计划于2003年完成了对遗传密码的破解。我们可以在人类的奖杯箱上再增加一个障碍:百万兆次级障碍。
百万兆次级障碍代表了实现百万兆次级计算的挑战,而百万兆次级计算长期以来一直被认为是高性能的基准。然而,要达到这个水平,计算机需要每秒执行五万亿次计算。你可以把一个万亿亿、十亿亿或一百万亿个亿想象成百万亿。无论您选择哪种方式,这都是一个难以理解的大量计算。
2022 年 5 月 27 日,由能源部橡树岭国家实验室建造的超级计算机 Frontier 完成了这一壮举。它每秒执行 1.1 万亿次计算,成为世界上最快的计算机。
但橡树岭的工程师们还没有完成。Frontier 仍然有一些技巧——或者更确切地说,是它的芯片组。这台超级计算机最近使用机器学习来获得创造另一项速度记录所需的超级提升。
打破百万兆次级障碍
关于 Frontier,首先要知道的是它很大。它包含 9,400 多个节点,每个节点本质上是一台独立的 150 teraflop 超级计算机。它们分布在 74 个相互连接的机柜中。根据橡树岭科学总监布朗森·梅塞尔(Bronson Messer)的说法,每个柜子的大小相当于一台商用冰箱,重量约为8,000磅(或者,他开玩笑说,如果我们以东田纳西州单位来衡量,则为两辆福特F-150)。
第二件需要知道的事情是,Frontier 的初始速度记录是使用一种称为双精度的格式设置的。双精度需要 64 位来表示数字,与单精度(使用 32 位)相比,该信息量允许计算包含广泛的数值。
“想想通过计算小数点后两位的圆周率与小数点后10位、20位或更多位来测量圆的区别,”橡树岭国家实验室计算机科学家Feiyi Wang说。
然而,虽然双精度可以执行具有高数值精度的计算,但这些额外的位是以计算资源(如处理能力)为代价的。为了更快地计算,Frontier 需要降低其精度以释放这些资源。这就是机器学习发挥作用的地方。
“与其说我们去进一步插上另一面旗帜,不如说是再插一面旗帜,”梅塞尔告诉Freethink。“[这个]基准测试是专门为人工智能和机器学习而设计的硬件。我们希望确保它也能在其能力的极限下工作。
重要的是,这种硬件并没有用于 Frontier 最初破纪录的运行。
Frontier 包含 9,400 多个节点,分布在 74 个巨型机柜中。每个节点本质上都是一台 150 teraflop 的超级计算机。(图片来源:橡树岭国家实验室/美国能源部)
Frontier 走向高超音速
在基准测试中,Frontier 被要求一次性求解一堆线性代数方程。这些方程式包含模式——某些步骤会反复出现——而 Frontier 的机器学习算法可以学习识别这些模式。一旦被识别,它就可以确定哪些方程需要什么精度。
如果方程需要高水平的数值精度,则 Frontier 使用双精度。但是,如果方程式不需要如此高的精度,超级计算机可以将精度限制回 32、24 甚至 16 位。此策略称为混合精度。
梅塞尔将这种策略比作在杂货店购物。双精度相当于检查每个过道,以确保您获得列表中的所有内容。这很彻底,但很耗时耗力。但是,一旦您学会了查看杂货店布局中的模式,您就可以通过仅访问某些过道并抓住特定物品来提高旅行效率。
“传统上,高性能计算都是以双精度完成所有事情,这是有充分理由的,”梅塞尔说。“很多问题都需要计算由于两种抵消力的影响而发生的事情。气候就是一个很好的例子。你有来自太阳、大气化学和各种东西的输入。
但是,梅塞尔补充说,在其他情况下,额外的准确性并不重要,因为计算不需要这么大的数字。当超级计算机学会为这些计算进行节流时,它可以节省大量计算资源的成本。
而 Frontier 就是这样做的。使用混合精度,超级计算机以每秒 9.95 万亿次计算的惊人速度运行。这大约是打破百亿亿次级障碍的计算速度的八倍——相当于在大约一年内从1马赫到高超音速。
拓展科学研究前沿
但它能运行孤岛危机吗?是的,它可以,梅塞尔笑着说。
Frontier 可以以全帧速率运行 10,000 次以上的《孤岛危机》或任何其他视频游戏。然而,由于该团队不允许在 Frontier 上玩游戏、挖掘加密货币或查看他们的社交媒体提要,他们转而利用其惊人的处理能力来推进科学和研究。
这台超级计算机目前正在帮助GE工程师研究湍流,并为开式风扇喷气发动机设计转子叶片。从理论上讲,这种发动机可以将燃油效率提高20%,使航空旅行更便宜、更清洁。
Frontier 还被用于模拟全球云层的形成。这些模型是能源百万兆次级地球系统模型的一部分,该项目旨在将Frontier的快速计算与新软件相结合,以创建准确预测数十年变化的气候模型。由于他们的努力,从事这些模拟的团队获得了 2023 年戈登贝尔气候建模特别奖.
“我们终于有了足够高的分辨率的气候模型,可以以每天模拟一年的速度解析气候模拟的云。这意味着你可以在大约一个月的时间内完成40年的气候运行,这是一项了不起的成就,“梅塞尔说。“[毕竟],你要确保你能比气候实际变化更快地运行你的模拟。
Frontier 还有可能帮助研究人员为医学治疗安排新的蛋白质结构,模拟自然灾害以帮助应急计划和预警,或者通过生成反应堆现象的高保真模型使核反应堆设计更安全。
“没有一门科学学科不会以某种方式受到超级计算的影响,”梅塞尔说。“我们将有从最大到最小的尺度的项目 - 从宇宙模拟到夸克被保存在原子核中。正是这种在人类探究领域中解决科学问题的能力,让我每天早上都起床并感到兴奋。
他补充说:“这就是我们的使命:使那些在其他任何地方都无法回答的问题成为可能。如果他们没有那么大的计算能力,他们甚至无法提出这个问题。
通过将这些问题与 Frontier 的计算速度相结合,谁知道有一天我们会突破哪些其他障碍。