HPC Technologies
HPCテクノロジーズ株式会社
High Performance Computing で科学技術計算をサポート
・HPCTテクニカルセンター ・製品カタログ ・プライスリスト ・ベンチマーク ・採用情報
FAQ (201708-01)
DPe,DPvMD系(サーバ/ストレージ) ハードウェアログ取得の方法
対象マシン : HPC-ProServer DPeシリーズ(PeC6系は除く), HPC-ProFS DPe/DPvMDシリーズ
対象OS : RHEL, CentOS, Windows Server
サーバ/ストレージを運用したままの状態で、ハードウェア的な不具合の解析などの際に必要となるログの取得方法を記載します。
※弊社でアラートメールの発信設定を行っている製品に関しては、同様のログがメールに自動で記載(あるいは添付)されています。
取得方法は、下記のような製品や構成によって異なりますので、順次記載します。
-
DPe系サーバ
-
DPe系サーバ+DPvMD1系ストレージ構成
-
DPe系サーバ+DPvMD3系ストレージ構成
-
DPeM1000(ブレードエンクロージャ)
※ログ取得で不明な点がありましたら、弊社サポート宛へお問い合わせ下さい。
※以下の管理ソフトウェアが該当サーバに導入されていることが前提ですが、弊社製品の標準構成では導入済みです。
DPe系サーバ : OMSA (OpenManage Server Administrator)
DPvMD3系ストレージを管理するDPe系サーバ : MDSM (Modular Disk Storage Manager)
1. DPe系サーバ (R420, R630 など)
OMSAのコマンドの一つである"omreport"で、概ねのログ取得は可能です。
以下のコマンド実行を行い、表示結果をリダイレクトなどでファイル出力(*.txt)して取得をお願いします。
※RHEL/CentOS系はCLIで、Windowsはコマンドブロンプト(管理者権限)で実行します。
$ omreport system summary > summary.txt ← ハードウェア構成のサマリ
$ omreport system esmlog > esmlog.txt ← BMC(iDRAC)上に記録されたハードウェアログ
$ omreport system alertlog > alertlog.txt ← OMSAによって収集したハードウェアに関するアラートログ
$ omreport chassis > chassis.txt ← 搭載コンポーネントのステータス一覧(RAID/ディスクを除く)
$ omreport storage controller controller=0 > cont0.txt ← RAID用等コントローラの状態(RAIDコントーラの場合、配下のHDD/RAID情報を含む)
上記ログで基本的な状況の確認が可能ですが、追加で下記のようなログ取得が必要になる場合もあります。
必要に応じて弊社からご案内します。
a. パーツ別の詳細ログ取得
"omreport chassis"コマンドによるパーツ指定(例)
$ omreport chassis memory > memory.txt ← メモリ情報/ステータス
$ omreport chassis pwrsupplies > pwrsupp.txt ← 電源ユニット情報/ステータス
$ omreport chassis fans > fans.txt ← ファン情報/ステータス
b. パーツ別の専用方法(omreport以外)でのログ取得
PERC(LSI)系のRAIDコントローラ内部保存のログ(TTYログ)
(RHEL/CentOS系はrootユーザ, Windows系は管理者権限で実行)
$ omconfig storage controller action=exportlog controller=0
こちらのログは画面表示されず、以下のファイルに出力(追記)されます。
(ファイル名の"MMDD"部はコマンドを実行した月日で、例えば4月7日ならば"0407"と指定)
[RHEL/CentOS系] /var/log/lsi_MMDD.log
[Windows系] C:¥Windows¥lsi_MMDD.log
nVIDIA製GPUの情報/ステータス
$ nvidia-smi > nvidia.txt ← サマリ情報
$ nvidia-smi -a > nvidia-a.txt ← 詳細情報/ステータス
$ nvidia-smi -L > nvidia-L.txt ← デバイス認識情報
2. DPe系サーバ+DPvMD1系ストレージ構成 (R610+MD1200, R730+MD1400 など)
サーバ側は、上記の項1.と同様に実施することでログ取得が可能です。
但し、ストレージ製品を接続したサーバは、外部ストレージ接続専用のRAIDコントローラを追加で搭載しています。
コントローラが複数の場合は、controller=<ID> が異なりますので、コントローラのログ取得は<ID>毎に実施が必要です。
(RAIDコントローラが二つの場合の例)
$ omreport storage controller controller=0 > cont0.txt ←"<ID>=0"のコントローラの状態
$ omreport storage controller controller=1 > cont1.txt ←"<ID>=1"のコントローラの状態
指定する controller=<ID> が不明な場合は、以下のコマンドを実行して下さい。
表示されたID項目の番号が各コントローラの<ID>となります。
$ omreport storage controller
3. DPe系サーバ+DPvMD3系ストレージ構成 (R610+MD3200, R730+MD3400 など)
サーバ側は、上記の項2.と同様に実施することでログ取得が可能です。
但し、DPvMD3系のストレージはRAIDコントローラ(RCM)搭載型のため、ストレージ側のコントローラログを更に別の方法で取得する必要があります。以下のコマンド実行することで、ストレージ側のコントローラ上のログを取得できます。
[RHEL/CentOS系の場合] rootユーザで実行
$ SMcli -n <ストレージアレイ名> -S -quick -c 'save storageArray supportData file="/tmp/supportData.7z";'
ログファイル名: /tmp/supportData.7z
[Windows系の場合] 管理者権限で実行
$ SMcli -n <ストレージアレイ名> -S -quick -c "save storageArray supportData file=¥"C:¥tmp¥supportData.7z¥";"
ログファイル名: C:¥tmp¥supportData.7z
※実行には数分から数十分掛かる場合があり、ログファイルのサイズが数MBから数十MBになることがあります。
※ログファイル名は、任意のパス/名前に変更できますが、拡張子まで指定する必要があります。
MDSMのバージョンによって異なりますが、Zipもしくは7-Zip形式の何れかの方式で圧縮されて出力されますが
7-ZipはZipの仕様も含まれてりますので、基本的に拡張子は".7z"にして頂いても問題はありません。
(".zip"を付けても".7z"が自動で追記される場合もあります)
※Tips: Windows系のコマンドプロンプトを使う際のエスケープ仕様(要約)
-
空白を含む引数は基本的には二重引用符「"」で囲むが、一重引用符「'」は常にデータ扱いで特殊な意味はない。
-
二重引用符「"」自体をデータに含める場合は、円記号「¥」を前置する。
-
二重引用符「"」の前にデータとして円記号「¥」を置きたい場合は、エスケープ用の円記号「¥」1つに加え、円記号「¥」を2個ずつセットで置く。
-
上記以外の円記号「¥」は単なるデータの「¥」になる。
-
特殊な意味を持つ文字「%」や「&」をエスケープしたい場合は、キャレット「^」を前置する。
SMcliコマンドの<ストレージアレイ名>は、ストレージにアクセスできる<IPアドレス>または<ホスト名>に置き換えることもできます。
※<ストレージアレイ名>指定は帯域内接続、<IPアドレス>または<ホスト名>指定は帯域外接続と呼ばれています。
(RHEL/CentOS系はrootユーザ, Windows系は管理者権限で実行)
$ SMcli <IPアドレス> -S -quick -c …
$ SMcli <ホスト名> -S -quick -c …
<ストレージアレイ名>や<IPアドレス>、<ホスト名>が不明の場合は、以下のコマンド実行で表示されます。
(RHEL/CentOS系はrootユーザ, Windows系は管理者権限で実行)
$ SMcli -d [-i]
--- 表示例 ---
arrayname ipaddress ipaddress ipaddress ...
---
"arrayname"部が <ストレージアレイ名>
"ipaddress"部が <IPアドレス>または<ホスト名>
※RCMの搭載状況や設定の関係で"ipaddress"部が複数表示されることがあります。複数表示された場合は一つ目を指定して下さい(仕様上はどれでも指定可能)。
※"ipaddress"部は、名前解決できる場合はホスト名、出来ない場合はIPアドレス表示になります(オプション"-i"を付けると必ずIPアドレス表示)。
※ネットワーク上に接続された別ストレージの情報が表示される場合もありますので、ご注意下さい。
4. DPeM1000(ブレードエンクロージャ)
管理サーバ(M1000eのCMCへネットワーク接続されているサーバ)にログインを行い、以下のようにのログ(*.txt)取得をお願い致します。
$ ssh root@<CMCのIPアドレス> racdump > racdump.txt
$ ssh root@<CMCのIPアドレス> dumplogs > dumplogs.txt
※実行後パスワードの入力を求められますが、ご不明な場合はお問い合わせください。
※<CMCのIPアドレス>は、該当するM1000eに搭載のCMCに割り振られた値となります。