スパコンの運用課題への取り組み
スパコン運用課題の解消策を常時模索
スパコンの運用にはいくつかの解決すべき課題がありますが、問題解消のために製造メーカーと連携して技術改善を行っています。あわせて、ユーザーにはスパコンで効率よく計算するためのプログラミング情報を提供しています。
効率性の追求

1TFLOPSあたりの歴代計算機の消費電力 (1時間当たり電力量÷理論演算性能)
半導体技術の進歩により、単位計算性能当たりの消費電力は劇的に減少していますが、その減少を上回る計算性能向上の要求があるため、スーパーコンピュータシステム全体としての消費電力削減努力がより必要となっています。
JSS2の主計算システムであるSORA-MAと前世代のJSSのMシステムを比較すると、設置面積当たり約180-200倍の性能になっています。

JSS1とJSS2のラック当たり性能比
これには、採用されているプロセッサーや高性能部品、設計も寄与しています。JSS2では、低消費電力とスループット(処理量)向上の両立を図ったプロセッサーが採用されており、JSS1と比べてプロセッサー当たり約25倍の性能があります。

JSS1とJSS2の主計算システムのプロセッサー

JSS2の主計算システムのCMUボード
また、高性能・高効率の部品や設計による電力効率の向上が図られています。
冷却技術・運用

SORA-MAの水冷システム
スパコンの回路は、集積度が上がると大量の熱を出すため、従来の空冷方式では冷却しきれなくなります。JSS2ではコールドプレートを用いた水冷方式を採用し、効率の良い発熱除去を行っています。
また、計算機室の環境を設置システムに合わせて変更しています。JSS2システムの設置面積縮小に合わせて壁を設置し、空調エリアを約1/2にしました。
JSS1で採用した設置上のホットアイル・コールドアイルの考え方は引き続き採用しています。
更に、継続的に空調温度設定を見直し、現在はJSS1当時よりも高いセ氏20度にしています。

JSS1当時と現在の空調エリア
水冷技術の採用と相まって、JSS2の空調に必要なエネルギー量はJSS1に比べて約1/6となりました。
ジョブスケジューリング

JSS1とJSS2の計算機稼働率
並列計算機を複数のユーザーが同時に利用する場合、大小様々な計算プログラムの実行(ジョブ)が不規則に投入されるため、これらのジョブを計算機の稼働率 を高く、かつ、公平に処理するためにジョブスケジューラが使用されます。
JSS1まではJAXAオリジナルのスケジューラを使用し、98%の高稼働率で運用していましたが、JSS2では計算機構成の複雑化に伴い、新しいスケジューラを採用しました。運用開始時は80%程度の稼働率でしたが、現在は運用・設定改善により85%となっています。引き続き稼働率向上に取り組んでいます。