【每日一知】神威·太湖之光超级计算机

  • 内容
  • 相关

神威·太湖之光(Sunway TaihuLight)运部署于中国超级计算无锡中心的中国超级计算机,由清华大学管理运营

操作系统为神威睿思操作系统(即RaiseOS 2.0.5)基于Linux开源代码开发

777.jpg

一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。每个单个处理器有260个核心,主板为双节点设计,每个CPU固化的板载内存为32GBDDR3-2133。


2016年6月20日在LINPACK性能测试中以 93 PFLOPS 的测试结果超越同为中国组建的天河二号(LINPACK成绩约为34 PFLOPS),成为当时世界上最快的超级计算机(2016年6月20~2018年6月8日)

高性能:神威太湖之光双精浮点峰值高达125PFlops,稳定性能为93PFlops,相比较之下,美国超算泰坦的双精浮点峰值高达27 Pflops,稳定性能为17.6 PFlops,天河2号的双精浮点峰值高达54.9Pflops,稳定性能为30.65Pflops。

高效率:“神威太湖之光”整机效率高达74.16%,相比较之下,美国超算泰坦的整机效率为65.19%,而河2号的整机效率为55.83%,由于超算性能越强,规模越大,整机效率提升就越困难,“神威太湖之光”在稳定性能是美国超算泰坦5.2倍的情况下,整机效率依然大幅优于泰坦。

低功耗:“神威太湖之光”的功耗为15.3 MW,美国超算泰坦功耗为9MW,天河2号为17.8 MW,可以说,“神威太湖之光”的稳定性能达到天河2号3倍的水平,但整机功耗却低于天河2号。

性能功耗比高:“神威太湖之光”的性能功耗比高达6G/W,相比之下,TOP500超算榜单上的竞争对手都相形见绌,天河2号的整机性能功耗比为1.95G/W,美国泰坦超算的性能功耗比为2.143G/W,美国超算红杉整机性能功耗比为2.069G/W,日本超算“京”整机性能功耗比为0.830/W,美国超算Mira整机性能功耗比为2.069G/W(Mira和红杉用的都是IBM的Power)。

小体积:“神威太湖之光”机柜占地605平方米,美国超算泰坦机柜占地面积404平方米,天河2号机柜占地面积720平方米



评价:


1.“中国已在这场比赛中大幅领先”——劳伦斯伯克利国家实验室副主任西蒙

2.“神威·太湖之光”的性能结束了“中国智能依靠西方技术才能在超算领域拔得头筹”的时代。——“TOP500”网站

3.“凭借一套搭载本土自主研发处理器芯片的世界一流超级计算机系统,中国巩固了在这一计算机最高领域的领导地位。”——《华尔街日报》


处理器

神威·太湖之光使用中国自主研发研发的 申威SW26010 峰值性能3,168万亿次每秒,核心工作频率1.5GHz,基于DEC Alpha 64微架构、64位、精简指令集、乱序运行、支持SIMD的申威-64架构

每个处理器芯片中有260个核心,采用大规模多核心并发运算的结构

其中4个为资源管理用途,称为MPE(Management Processing Element,管理处理组件),采用对称多处理器的结构;另外256个作通用运算用途,每64个核心组成一个处理器核心阵列,共计4个阵列,合称为CPE(Computing Processing Element,运算处理组件)。

MPE和CPE的连接布局类似于Cell的协处理器式、非对称多处理的布局(PPE+SPE),而CPE的阵列则与Xeon Phi、GPGPU等的流处理器形式相近。CPE核心和MPE核心都是相同的指令集,同样具备256比特SIMD单元,但不同的是MPE均支持用户模式和系统模式、32KiB一级指令缓存、32KiB一级资料缓存、256KiB二级缓存,而CPE仅支持用户模式、16KiB一级指令缓存、64KiB本地暂存式存储器而无资料缓存,而且访问系统存储器需要与MPE沟通。该CPU时脉设置在 1.45GHz。不过,存储器访问方面的规格相对较为贫弱,使用的是四通道DDR3 SDRAM,各通道拥有独立的、128位位宽的存储器控制器,每通道容量 8GiB,一颗CPU可最大支持32GiB的DDR3-2133,尽管如此,每个芯片的存储器带宽仍达 136.5GB/s。除此以外,每颗芯片上还内置了片上网络互联,而非传统的缓存一致性处理。因此,该CPU与Cell宽带引擎一样,偏重于浮点数运算。


整套系统高达 40,960 个 SW26010处理器,共有 10,649,600 个CPU核心。每个处理器为一个节点单元,一块主板上有两颗处理器,32块这样的主板组成一架主机,每台主机作为一个“超级节点”,一共有256个这样的超级节点。根据资料图显示,这样的构造使得主机需采用非标准设计,而非标准的刀片服务器机架和机柜,这样的一种机柜可以容纳4台主机机架。运算节点单元之间全数采用PCIe总线互联,互联结构分为三层,顶层网络是“中央切换网络”,中间层是“超级节点网络”,底层是“资源共享网络”。

特点

神威·太湖之光超级计算机由40个运算机柜和8个网络机柜组成。柜内4块由32块运算插件组成的超节点分布其中。每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器。一台机柜就有1024块处理器


THZG.jpg

作者信息
头像
描述: 一起用互联网帮助更多人

本文标签:

本文链接:【每日一知】神威·太湖之光超级计算机 - http://www.go176.net/post-6938.html

剑客网,一起用互联网帮助更多人