高い内部並列処理効率が期待される新Xeon (Nehalem)によるAmber 10 pmemdでのfactor_ixベンチマーク結果が寄せられ、新Xeon (Nehalem) + Amber10の8並列処理において、旧Xeon (Core) + Amber9での8並列処理より2倍も高速であることが確認されました。その結果をご報告します。具体的には、性能向上は主に次の2つの要素によってもたらされています。そこでそれらの影響の度合いを確認します。
最初に旧Xeon (Core)環境上にて、Amber 9とAmber 10の比較をします。青色ラインで表記しているのがAmber 9 + 旧Xeon (Core) 3.16GHz、空色ラインで表記しているのがAmber 10 + 旧Xeon (Core) 2.66GHzです。Amber 10は2.66GHzのプロセッサで動かしているにもかかわらず、3.16GHzのプロセッサで動かしているAmber 9よりも高速です。これはAmber 10のコードが高速化されていることを示しています。しかしAmber 9、Amber 10の双方共に8並列処理では処理効率が低下しています。これはCPUに原因があります。
次に新Xeon (Nehalem)環境上にて、Amber 9とAmber 10の比較をします。オレンジ色ラインで表記しているのがAmber 9 + 新Xeon (Nehalem)、赤色ラインで表記しているのがAmber 10 + 新Xeon (Nehalem)です。こちらもAmber 10になったことで30%程度も高速化しています。さらに新Xeonでは8並列処理でも並列効率の低下が発生していません。CPU改善の効果が発揮されています。
さらにAmber 10環境上にて、旧Xeon (Core) 2.66GHzと、新Xeon (Nehalem) 2.93GHzの比較をします。 空色ラインで表記している方がAmber 10 + 旧Xeon (Core) 2.66GHz、赤色ラインで表記している方がAmber 10 + 新Xeon (Nehalem) 2.93GHzです。2並列、4並列でも新Xeon (Nehalem)の方が高速です。さらに8並列では旧Xeonが並列化効率を低下させているのに対して、新Xeonでは並列化効率が低下していません。
では新Xeon (Nehalem) + Amber10の絶対的な並列化効率はどうでしょうか。そこで比較のため、新Xeon (Nehalem) + Amber10の理想値をピンク色の破線で表記しました。8並列でも約80%もの高い処理効率を示しています。

| Amber 9, 10 pmemd factor_ixベンチ | |||||
| Amberバージョン | CPU仕様 | スレッド数 / 経過時間 (秒) | |||
| 1 | 2 | 4 | 8 | ||
| Amber 9 | Xeon (Core) X5460 3.16GHz | - | 179 | 92 | 67 |
| Amber 10 | Xeon (Core) E5430 2.66GHz (*1) | - | 163 | 87 | 59 |
| Amber 9 | Xeon (Nehalem) X5570 2.93GHz | - | 153 | 77 | 43 |
| Amber 10 | Xeon (Nehalem) X5570 2.93GHz | 210 | 119 | 60 | 33 |
(*1) Amber Home PageのAmber 10べチンマーク結果より引用。
また、Amber 10と最新Xeon (Nehalem)を組み合わせた並列性能調査は他でも行われており高い評価が得られているようです。