CentOSをそのままインストールしただけでは、HPC用の計算機やクラスタとしてのセットアップはできません。標準のLunix OSはサーバ利用を想定してパッケージ化されており、特にセキュリティ関連の設定は厳しいです。その反面、HPC用途では必須のパッケージがデフォルトでは含まれていません。さらに、並列計算を行うための各種機能や設定なども無効化されています。
Lnux OSをHPC用にセットアップするには、HPCで必要なパッケージの追加と並列計算を行うために必要な各種設定のカスタマイズを行わなければなりません。また、不必要なデーモンやサービスを停止し、必要なデーモンやサービスは起動するように設定します。さらに自動アップデート機能も無効にします。例えばもしこの自動アップデートが有効のままにされていると、パッケージが自動的にバージョンアップされるため、それまで安定していた計算機が突然運用できなくなることがあります。
HPCクラスタではネットワーク設定も重要ポイントです。ネットワークはデフォルト設定のままでもある程度の運用は可能なため、これが重要なポイントとは思われない場合も多いのです。しかし、デフォルト設定は並列計算での最良の設定ではありませんから、ネットワーク性能をフルに活かしていなかったり、利用制限が掛かったままの状態で運用されていることがよくあります。デフォルトのままで使用していても表面上は動いているため、まだまだ性能が引き出せたり、より安定して動作するということが判らないのです。
弊社はPCクラスタに関する多くの経験を持っており、新製品の性能と、過去の社内でのベンチマーク結果とを照らし合わせることで、新製品の潜在的な問題を容易に見つける、チューニングに反映させることが容易にできます。先のネットワーク設定での課題などでも経験が少ないと、性能が出ていない状態や不安定な状態でも、それに気がつきにくいケースが多いです。