Top > HPCTテクニカルセンター > UGEコマンドリファレンス qhost

NAME
       qhost - show the status of Univa Grid Engine hosts, queues, jobs

 

SYNOPSIS
       qhost  [  -F [resource_name,...]  ] [ -help ] [ -h host_list ] [ -j ] [-l resource=val,...  ] [ -ncb ] [ -si session_id ]

       [ -u user,...   ]  [-xml ]

【説明】
qhostは、使用可能なUniva Grid Engineホスト、キュー、およびキューに関連付けられているジョブの現在のステータスを示します。選択オプションを使用すると、特定のホスト、キュー、ジョブまたはユーザーに関する情報を取得できます。複数の選択が行われた場合、ホストの選択基準がすべて満たされた場合にのみホストが表示されます。オプションを指定しないとqhostはキューまたはジョブ情報のないすべてのホストのリストを表示します。

 

【オプション】
-F [resource_name,...]

qhostは、すべてのリソース(オプション引数が省略されている場合)またはresource_nameリストに含まれるリソースに関して、ホストごとの現在のリソース可用性の詳細なリストを表示します。詳細については、以下のOUTPUT FORMATSのFull Formatの説明を参照してください。

-help

すべてのオプションのリストを出力します。

-h host_list

host_listに含まれるすべてのホストのリストを出力します。

-j

示されたホストによってホストされているキューで、実行中のすべてのジョブを出力します。このスイッチは、-qを暗黙的に呼び出します。

-l resource[=value],...

ホストリスト出力に含めるべきホストによって与えられるリソースを定義します。マッチングは、変更不可能なリソースの可用性情報のみに基づいて、ホスト上で実行されます。つまり、いわゆる静的負荷値(すなわち、"arch"、"num_proc"、"mem_total"、"swap_total"および"virtual_total")以外の負荷値は常に無視されます。consumable使用も無視されます。複数の-lリソース要求がある場合、それらは論理積で連結されます。つまり、ホストは表示されるすべてのリソースと一致する必要があります。

 

-ncb

このコマンドラインスイッチは、他のqhost(1)コマンドラインスイッチで6.2u5互換の出力を得るために使用できます。その場合、対応するコマンドの出力は、実行ホストトポロジーに関する情報を抑制します。このオプションは、次のメジャーバージョンでは削除されることに注意してください。

-q

表示されたホストによってホストされているキューインスタンスに関する情報を表示します。

-si session_id

このクライアントからsge_qmaster(1)デーモンに送信された要求は、指定されたセッションの一部として実行されます。スイッチが省略されている場合、またはNONEがsession_idとして指定されている場合、そのような要求はセッションの制御の外で実行されます。

session_conf(5)のセッションに関する詳細情報を参照してください。

-u user,...

特定のユーザーリストのユーザーに関連付けられているジョブとキューにのみ情報を表示します。

-xml

このオプションは他のすべてのオプションで使用でき、出力をXMLに変更します。使用されるスキーマは、XML出力で参照されます。出力はstdoutに出力されます。

-xmlパラメータを-ncbと組み合わせると、XML出力に6.2u5互換出力が含まれます。

【OUTPUT FORMATS】
-qまたは-Fおよび-jオプションの有無に応じて、3つの出力形式を区別する必要があります。

Default Format(without -q, -F and -j)
ホストごとに1行が出力されます。出力は以下の項目からなります。

  • ホスト名

  • アーキテクチャー

  • プロセッサー数

  • 負荷

  • 合計メモリ

  • 使用メモリ

  • 合計スワップスペース

  • 使用スワップスペース

-qオプションを指定すると、各ホストのステータス行には、ホストによってホストされるキューごとに追加の行が含まれ、それは以下の項目からなります。

  • キュー名

  • キュータイプ - B(atch)、I(nteractive)、C(heckpointing)、P(arallel)またはこれらの組み合わせのうちの1つ

  • 予約済み、使用済みおよび使用可能なジョブスロットの数

  • キューの状態 - 対応するsge_execd(8)に接続できない場合はu(nknown)、a(larm)、A(larm)、C(alendar suspended)、s(uspended)、S(ubordinate)、d(isabled)、D(isabled)、E(rror)またはそれらの組み合わせのうちの1つ

状態がa(alarm)の場合、キュー構成のload_thresholdsリスト(queue_conf(5)を参照)で定義されている負荷しきい値の少なくとも1つが現在超過していて、そのキューへの更なるジョブのスケジューリングが妨げられています。

これに対して、状態A(larm)は、キューのサスペンドしきい値(queue_conf(5)を参照)の少なくとも1つが現在超過していることを示します。これにより、しきい値に違反しなくなるまで、そのキューで実行されているジョブが順次中断されます。

s(uspended)とd(isabled)状態は、キューに割り当てられ、qmod(1)コマンドで解放することができます。キューをサスペンドすると、そのキューで実行中のすべてのジョブがサスペンドされます。

D(isabled)とC(alendar suspended)は、Univa Grid Engineのカレンダー機能(calendar_conf(5)を参照)を介してキューが自動的に無効または中断されたことを示し、S(ubordinate)状態は、キューが別のキューへの従属を介してサスペンドしていることを示します(詳細はqueue_conf(5)を参照)。(原因を問わず)キューをサスペンドすると、そのキューで実行中のすべてのジョブもサスペンドされます。

キューに対してE(rror)状態が表示された場合は、そのホスト上のsge_execd(8)はジョブを開始するためにそのホスト上で実行可能なsge_shepherd(8)を見つけることができませんでした。

問題の解決方法については、sge_execd(8)のエラーログファイルを確認してください。後でqmod(1)コマンドの-cオプションを使用してキューを手動で有効にしてください。

 

-Fオプションが使用された場合、リソースの可用性情報はホストのステータス行の後に出力されます。各リソース(-Fのオプション引数で選択されたもの、またはオプション引数が省略されている場合はすべてのリソース)に対して、次の形式で1行が表示されます:

  • 現在のリソースの可用性の値がどちらに支配されていたかどうかを示す1文字の指定子

 `g' - クラスタグローバル
 `h' - ホストトータル

  • 現在のリソースの利用可能な値のソースを示す2番目の1文字の指定子

 `l' - リソースに対して報告された負荷値
 `L' - 管理者定義の負荷スケーリングが適用された後のリソースの負荷値
 `c' - consumableリソース機能から得られた利用可能性(complexes(5)参照)
 `f' - non-consumable complex属性または固定リソース限度から導出された固定利用可能性定義

  • コロンの後、情報が表示されるリソースの名前

  • 等号の後、現在のリソースの利用可能値

表示される利用可能値とそれが派生するソースは、常にすべての可能な組み合わせの最小値です。したがって、例えば、"qf:h_vmem=4G"の形式の行は、現在キューが4ギガバイトの仮想メモリ内で最大の可用性を有していることを示しますが、この値は固定値(例えば、キュー構成のリソース制限値)で、キュー支配的です。つまり、ホストが合計でこれよりも多くの仮想メモリを使用できるとしても、キューはそれ以上のものを許可しません。逆に、"hl:h_vmem=4G"という行は、4ギガバイトの仮想メモリの利用可能値の上限を示しますが、その限度は現在ホストに対して報告されている負荷値から導き出されます。そのため、仮想メモリ要件の高いジョブをキューに入れると、このキューが存在するホストは現在4ギガバイトしか使用できません。

 

キューステータス行(-jの場合)の後に、このキューに現在実行されているジョブごとに1行が出力されます。各ジョブのステータス行には以下の項目が含まれます。

  • ジョブID

  • ジョブ名

  • ジョブの所有者名

  • ジョブのステータス - t(ransfering)、r(unning)、R(estarted)、s(uspended)、S(uspended)、T(hreshold)のひとつ(詳細については、Reduced Formatのセクションを参照してください)

  • 開始日時とジョブの機能(MASTERまたはSLAVE - パラレルジョブの場合にのみ意味があります)

  • ジョブの優先順位

【ENVIRONMENTAL VARIABLES】

SGE_ROOT       

Univa Grid Engineの標準設定ファイルの場所を指定します。


SGE_CELL       

設定されている場合、デフォルトのUniva Grid Engineセルを指定します。 Univa Grid Engineセルに対処するために、qconfは(優先順位で)以下を使用します。

  • 設定されている場合、環境変数SGE_CELLで指定されているセルの名前。

  • デフォルトのセルの名前(default)。

SGE_DEBUG_LEVEL

設定されている場合、デバッグ情報をstderrに書き込むように指定します。さらに、デバッグ情報が生成される詳細レベルが定義されます。

SGE_QMASTER_PORT

設定されている場合、sge_qmaster(8)が通信要求をリッスンする予定のTCPポートを指定します。ほとんどのインストールでは、代わりにサービスマップエントリを使用してそのポートを定義します。

SGE_GDI_REQUEST_REDUCE_LEVEL

この環境変数を使用して、qhostクライアントに転送されるデータの量を減らすことができます。 qhostクライアントは、要求された出力を提供するためにsge_qmasterデーモンから必要なデータ・リストを要求しています。異なる削減レベルを選択することにより要求されるデータを削減することが可能である。

 

このパラメータのデフォルト値は "1"です。環境変数がまったく設定されていない場合、結果の削減レベルも "1"になります。

 

レベル「0」を使用して完全に消滅をオフにすると、sge_qmasterデーモンから要求されるデータ・サイズが大きくなります。

 

レベル「2」は、レベル「1」より多くのデータを削減するが、現在「実験的」状態にある。エラーが発生した場合、重大なロギングが発生し、qhostはゼロ以外の終了状態で終了します。

【FILES】
       <sge_root>/<cell>/common/act_qmaster
                       Univa Grid Engine master host file

【SEE ALSO】
       sge_intro(1),   qalter(1),   qconf(1),   qhold(1),  qmod(1),  qstat(1),
       qsub(1), queue_conf(5), session_conf(5), sge_execd(8),  sge_qmaster(8),
       sge_shepherd(8).

【COPYRIGHT】
       See sge_intro(1) for a full statement of rights and permissions.

 

Univa Grid Engine User Commands    UGE 8.5.3                          QHOST(1)

© 2006-2019 HPC Technologies Co., Ltd. All rights reserved.