コンピュータアーキテクチャの話 第445回 地球シミュレータのピークベクトル演算性能は40.96TFlops

コンピュータアーキテクチャの話 第445回 地球シミュレータのピークベクトル演算性能は40.96TFlops

  • マイナビニュース
  • 更新日:2020/10/16
No image

極細同軸でメインメモリとCPUを接続

NEC、最新世代ベクトル型スパコンを地球シミュレータとしてJAMSTECに納入

次の図は、NECスパコンのメモリテクノロジの比較の図である。SX-5のボードはSDRAMを使い、記憶容量は4GBであったが、ESではFPLRAMを使い512MBと1/8の記憶容量となっている。これはメモリバンド幅を優先してカスタムDRAMを作ったことによるロスであろうか。

高バンド幅のCPUとメインメモリの間の接続も極細同軸を約2万本と膨大である。システム全体では、このケーブルの長さは9000kmに上る。この接続には医療機器の超極細同軸ケーブルの技術を応用したという。次の図に断面図が書かれているが、0.66mm×0.85mmというシャープペンシルの芯と同じくらいの太さの同軸ケーブルを使い、ノードあたり2万本の接続を行うのは大変である。

単段クロスバを使う地球シミュレータシステム

そして、地球シミュレータ全体は640のノードを持ち、それらは単段のクロスバに繋がっているという構造になっている。単段のクロスバはノード間に専用のデータの通路があり、通信パターによって込み具合が変わってバンド幅が小さくなってしまうというようなことがない。

同一チップに入っている8台のプロセサは共通メモリで仕事の分担は容易であるが、他のチップのメモリのデータは直接はアクセスできず、ノード間のMPI通信が使われた。

地球シミュレータシステムはPN筐体に2ノードを収容し、320筐体に640ノードを集積している。1個のCPUチップにVPPを8台搭載しているので、システム全体では5120台のVPPがあることになる。5120×0.5GHz×16Flops/サイクルでピークベクトル演算性能は40.96TFlopsとなる。

そして、ノード間を接続する単段クロスバを収容するのがIN筐体である。PN筐体のDWHは140cm、100cm、200cmであるが、IN筐体は120cm、130cm、200cmで多少大きい筐体である。

クロスバはノード当たり12.3GB/sのデータ転送ができ、システム全体では7.8TB/sのデータ転送性能を持っている。

Hisa Ando

この記事をお届けした
グノシーの最新ニュース情報を、

でも最新ニュース情報をお届けしています。

外部リンク

  • このエントリーをはてなブックマークに追加