Top > HPCTテクニカルセンター > UGEコマンドリファレンス qstat
NAME
qstat - show the status of Univa Grid Engine jobs and queues
SYNTAX
qstat [ -explain {a|A|c|E|m}[+] ] [ [ -ext ] [ -f|-fjc ] [ -F [resource_name,...] ] [ -g {c|d|t}[+] ] [ -help ] [ -j [job_list] ] [ -nenv ] [ -l resource=val,... ] [ -ne ] [ -pe pe_name,... ] [ -ncb ] [ -njd ] [ -pri ] [ -q wc_queue_list ] [ -qs {a|c|d|o|s|u|A|C|D|E|S} ] [ -r ] [ -s {r|p|s|z|S|N|P|hu|ho|hs|hd|hj|ha|h|a}[+] ] [ -si session_id] [ -t ] [ -U user,... ] [ -u user,... ] [ -urg ] [ -xml ]
説明
qstatは、使用可能なUniva Grid Engineのキュー、ジョブクラス、およびジョブの現在のステータスを表示します。選択オプションを使用すると、特定のジョブ、ジョブクラス、キュー、またはユーザーに関する情報を取得できます。複数の選択が行われた場合、キューまたはジョブクラスは、キューインスタンスのすべての選択基準が満たされている場合にのみ表示されます。オプションを指定しないと、qstatはキューまたはジョブクラスのステータス情報のないジョブのリストのみを表示します。
管理者とユーザーは、以下に説明するオプションのいずれかを含むファイル(sge_qstat(5)を参照)を定義できます。クラスター全体のsge_qstatファイルは、$SGE_ROOT/$SGE_CELL/common/sge_qstatの下に置くことができます。ユーザー個人用のファイルは、$HOME/.sge_qstatの場所で検索されます。ホームディレクトリの要求ファイルは、クラスターグローバルのファイルよりも優先順位が高くなります。コマンドラインを使用して、ファイルに含まれているフラグを上書きすることができます。
オプション
-explain a|A|c|E|m
文字'c'は、キューインスタンスの構成が曖昧な(configuration ambiguous)状態、ジョブクラスのバリアントの構成が競合している(configuration conflict)状態の理由を表示します。'a'はアラーム状態の理由を示します。サスペンドアラーム状態の理由は'A'で表示されます。'E'は、キューインスタンスエラー状態の理由を表示します。'm'は、キュー状態の変更がトリガされたとき、キューに付随するマネージャーメッセージを示します(qmod(5)の-msgを参照)。
アラームの理由の出力形式は、リソース値としきい値を含む理由ごとに1行です。リソース値の詳細については、後述のOUTPUT FORMATSセクションのFull Formatの説明を参照してください。
-ext
ジョブチケットポリシースキームに関連する各ジョブの追加情報を表示します(後述のOUTPUT FORMATSを参照)。
-f
"フル"形式の情報の表示を指定します。-fオプションを指定すると、すべてのキューの要約情報が、キューに登録されたジョブリストと共に表示されます。
-fjc
"ジョブクラス"形式の情報の表示を指定します。-fjcオプションを指定すると、すべてのジョブクラスのバリアントに関する要約情報がアクティブなジョブのリストとともに表示されます。
-F [ resource_name,... ]
-fの場合と同様に、すべてのジョブとキューに情報が表示されます。さらに、qstatは、すべてのリソース(オプション引数が省略されている場合)またはresource_nameリストに含まれるリソースに関して、キューごとの現在のリソース可用性の詳細なリストを表示します。詳細については、後述のOUTPUT FORMATSのFull Formatの説明を参照してください。
-flt {pe|project} name
特定のpeまたはプロジェクトに属するすべてのジョブを表示します。peまたはプロジェクトのいずれかでソートすることは可能です。
-g {c|d|t}[+]
-gオプションを使用すると、表示されているオブジェクトのグループ化を制御できます。
-g cを使用すると、クラスターキューの概要が表示されます。詳細については、OUTPUT FORMATSのセクションを参照してください。
-g dを使用すると、アレイジョブは、ジョブタスクごと1行に冗長表示されます。デフォルトでは、アレイジョブはグループ化され、同じステータスのすべてのタスク(保留中のタスクのみ)が1行に表示されます。出力のアレイジョブタスクid範囲のフィールド(OUTPUT FORMATSセクション参照)は、対応する一連のタスクを指定します。
-g tを指定すると、パラレルジョブはジョブタスクごと1行に冗長表示されます。デフォルトでは、パラレルジョブのタスクは1行に表示されます。また、-g tオプションを指定すると、ジョブスロットの量ではなく、各パラレルタスクの機能が表示されます(OUTPUT FORMATSセクションを参照)。
-help
すべてのオプションのリストを出力します。
-j [job_list]
保留中のすべてのジョブまたはjob_listに含まれるジョブのさまざまな情報を出力します。job_listには、job_ids、job_names、またはワイルドカード表現(sge_types(1))を含めることができます。
エラー(E)状態のジョブの場合、エラー理由が表示されます。最後のスケジューリング間隔でディスパッチできなかったジョブについては、sched_conf(5)の'schedd_job_info'がそれに応じて設定されている場合、障害が表示されます。
実行中のジョブの場合、利用可能なリソース使用率に関する情報は、消費されたCPU時間(秒)、積算メモリ使用量(Gバイト秒)、転送データ量(GB)、I/O待機時間(秒)、I/O操作数、現在の仮想メモリ使用量(MB)、最大仮想メモリ使用量(MB)について表示されます。この情報は、ジョブがホストされているOSプラットフォームでリソース使用率の取得がサポートされていない場合は使用できません。Linuxホストでは、execd param ENABLE_MEM_DETAILSが1(またはtrue)に設定されていると、追加のメモリー値が報告されます。(sge_conf(5)も参照):rss(resident set size)、pss(proportional set size)、shared memory、private memory、maxrssとmaxpss.
管理者がsge_qstatファイルに"-njd"スイッチを追加すると、マネージャーとオペレーターのみが他のユーザのジョブを一覧表示できます。"-njd"スイッチが有効な場合、ユーザーは自分のジョブだけを表示できます。
ジョブにリソース予約がある場合は、予約開始と終了時間、オプションでジョブが予約された並列環境、キューインスタンス、およびジョブ用に予約されたスロット数に関する情報が表示されます。
標準的なロード値セットの詳細については、<sge_root>/doc/load_parameters.ascファイルを参照してください。
-jc jc_list
ジョブクラスのバリアントの名のリストを指定しますと、ジョブ情報が表示されます。sge_types(1)のjc_listの定義を探して下さい。
-nenv
-j job_listと組み合わせると、ジョブの環境変数は要求されません。
-l resource[=value],...
ジョブによって要求される、または情報が要求されるキューによって許可されるリソースを定義します。マッチングは、変更不可能なリソースの可用性情報のみに基づいてキューに対して実行されます。これは、いわゆる静的負荷値(すなわち、"arch"、"num_proc"、"mem_total"、"swap_total"および"virtual_total")を除いて常に負荷値が無視されることを意味します。consumableの使用も無視されます。保留中のジョブは、上記のいずれかのキューで実行されるジョブに制限されます。同様に、キュージョブマッチングは、変更不可能なリソース利用可能性情報のみに基づいている。複数の-lリソース要求がある場合、それらは論理積で連結されます。:キューは表示されるすべてのリソースと一致する必要があります。
-ne
-fと組み合わせると、空のキューの表示が抑制されます。つまり、実際にジョブが実行されていないすべてのキューは表示されません。
-ncb
-ncbと組み合わせると、コマンドの出力によって、要求されたバインディングの情報と、ジョブが実行されているホストのトポロジ文字列(実際のバインディング)に適用された変更が抑制されます。この情報は、-rおよび-jパラメータと組み合わせて表示されなくなります。
このコマンドラインスイッチは下位互換性を提供することを目的としており、次回のメジャーリリースでは削除される予定です。
-njd
-njdパラメーターを使用すると、通常のユーザーがqstat -jを使用して他のユーザーからのジョブのジョブの詳細を表示できないようにすることができます。このスイッチは、adminユーザーによってsge_qstatファイルに追加できます。
-pe pe_name,...
コンマ区切りのオプション引数に指定された並列環境の少なくとも1つに接続されているキューに関する状態情報を表示します。ジョブのステータス情報は、選択されたキューの1つで実行されるもの、または保留中であり、原則としてそれらのキューにスケジュールされるもののいずれかに対して表示されます。
-pri
ジョブの優先順位に関連する各ジョブの追加情報を一般的に表示します。(後述のOUTPUT FORMATSを参照してください)。
-q wc_queue_list
ジョブ情報を表示するワイルドカード表現のキューリストを指定します。sge_types(1)のwc_queue_listの定義を探して下さい。
-qs {a|c|d|o|s|u|A|C|D|E|S}
状態に応じたキューインスタンスのフィルタリングを許可します。
-r
表示されたジョブのリソース要件に関する拡張情報を表示します。詳細については、OUTPUT FORMATSのサブセクションのExpanded Formatを参照してください。
-s {p|r|s|z|S|N|P|hu|ho|hs|hd|hj|ha|h|a}[+]
指定された状態のジョブのみを出力します。状態の任意の組み合わせが可能です。-s prsSNPは、-sがまったくない通常のqstat出力に対応します。最近終了したジョブを表示するには、-s zを使用します。user/operator/system/array-dependency holdにジョブを表示するには、-s hu/ho/hs/hdオプションを使用します。優先ジョブをS、NまたはP状態で表示するには、-s S/N/Pオプションを使用します。-s haオプションは、qsub -aコマンドで送信されたジョブを表示します。qstat -s hjは、ジョブがジョブ依存リストにエントリを持たない限り、実行に適さないすべてのジョブを表示します。qstat -s hはqstat -s huhohshdhjhaの略語であり、qstat -s aはqstat -s psrSNPの略語です(qsub(1)の-a、-hold_jidおよび-hold_jid_adオプションを参照)。
-si session_id
このクライアントからsge_qmaster(1)デーモンに送信された要求は、指定されたセッションの一部として実行されます。スイッチが省略されている場合、またはNONEがsession_idとして指定されている場合、そのような要求はセッションの制御の外で実行されます。
session_conf(5)のセッションに関する詳細情報を参照してください。
-t
表示されたパラレルジョブの制御されたサブタスクに関する拡張情報を出力します。詳細な情報については、OUTPUT FORMATSのサブセクションのReduced Formatを参照してください。パラレルジョブのサブタスクをアレイジョブのタスクと混同しないでください(上の-gオプション、qsub(1)の-tオプションを参照)。
-U user,...
指定されたユーザーがアクセスできるキューに関する状態情報を表示します。ジョブのステータス情報は、選択されたキューの1つで実行されるもの、または保留中であり、原則としてそれらのキューにスケジュールされるもののいずれかに対して表示されます。
-u user,...
特定のユーザーリストのユーザーに関連付けられているジョブとキューにのみ情報を表示します。追加の-fオプションまたは-Fオプションが指定されている場合、およびユーザーがそれらのキュー内のジョブを実行している場合は、キューステータス情報が表示されます。
文字列$userは、現在のユーザー名のプレースホルダーです。ユーザー名のワイルドカードとしてアスタリスク"*"を使用して、ユーザーのジョブを表示することができます。このスイッチのデフォルト値は-u $userです。
-urg
ジョブ緊急性ポリシースキームに関連する各ジョブの追加情報を表示します(後述のOUTPUT FORMATSを参照)。
-xml
このオプションは他のすべてのオプションで使用でき、出力をXMLに変更します。使用されたスキーマは、XML出力で参照されます。出力はstdoutに出力されます。詳細については、qstatコマンドのスキーマは$SGE_ROOT/util/resources/schemas/qstatにあります。
-xmlパラメータを-ncbと組み合わせると、XML出力にジョブとコアのバインディングに関する情報を含むタグが含まれません。変更を記述するディレクトリ、$SGE_ROOT/util/resources/schemas/qstatに接尾辞"_ncb"を持つスキーマファイルを見つけることもできます。
OUTPUT FORMATS
-explain/-f/-F/-qs、-r、-tオプションの有無により、3つの出力フォーマットを区別する必要があります。-extオプションと-urgオプションを使用して、各ジョブの追加情報を表示することができます。
Cluster Queue Format (with -g c)
ヘッダー行に続いて、各クラスターキューのセクションが提供されます。キューインスタンスの選択が適用されると(-l -pe、-q、-U)、クラスターフォーマットには対応するキューインスタンスのクラスターキューのみが含まれます。
-
クラスタキュー名
-
すべてのキューホストの正規化された負荷平均の平均
各ホストに異なる重要度を反映させるために、構成済みスロットの数は、クラスターキューの負荷を判断する際の重み係数として使用されます。この値にはnp_load_valueのホストのみが考慮されますので、その点に注意してください。キューの選択が適用されると、選択されたキューに関するデータのみがこの形式では考慮されます。いずれかのホストで負荷値が使用できない場合は、complex属性定義の値の代わりに、'-NA-'が出力されます。
-
現在使用されているスロットの数
-
あらかじめ予約されているスロット数
-
現在使用可能なスロットの数
-
スロットの総数
-
状態'aoACDS'の少なくとも1つにあり、状態'cdsuE'のいずれにもないスロットの数
-
'cdsuE'状態の1つまたはそれらの任意の組み合わせにあるスロットの数
-
-g cオプションは-extと組み合わせて使用できます。この場合、追加の列が出力に追加されます。各列には、使用可能なキュー状態の1つに対するスロット数が含まれています。
Reduced Format (without -f, -F, and -qs)
ヘッダー行に続いて、以下の項目で構成されるジョブごとに行が出力されます。
-
ジョブID
-
保留中のジョブリスト内のジョブの位置を決定するジョブの優先順位
優先度の値は、チケットおよび緊急性ポリシーの設定(sge_priority(5)も参照)に基づいて動的に決定されます。
-
ジョブの名前
-
ジョブ所有者のユーザー名
-
ジョブの状態 - d(eletion)、E(rror)、h(old)、r(unning)、R(estarted)、s(uspended)、S(uspended)、N(eNhanced suspended)、P(reempted)、T(hreshold)またはw(aiting)のひとつ。
状態d(eletion)は、ジョブの削除を開始するためにqdel(1)が使用されたことを示します。状態t(ransfering)とr(unning)は、ジョブが実行されようとしているか、またはすでに実行中であることを示しているが、s(uspended)、S(uspended)、e(N)hanced suspended、(P)reemptedとT(hreshold)は、すでに実行中のジョブがサスペンドされたことを示します。
s(uspended)状態は、qmod(1)-sコマンドを使用してジョブを一時停止することによって発生し、S(uspended)状態は、ジョブを含むキューがサスペンドされていて、したがってジョブもサスペンドしていることを示しているか、保留中のジョブが、システムによって自動的にトリガされるか、qmod(1)-p ... Sを介してトリガされる手動プリエンプション要求によってプリエンプティブな処理が行われたために一時停止されたことを示しています。保留中のジョブリスト内のe(N)hanced suspendedおよび(P)reemptedジョブは、自動的にまたはqmod(1)-p ... Nか-p ... Pを介してトリガーされた保留中のジョブに対して示されるプリエンプティブな状態です。T(hreshold)状態は、対応するキューの少なくとも1つのサスペンドしきい値が超過したことを示し(queue_conf(5)を参照)、結果としてジョブがサスペンドされたことを示します。状態R(estarted)は、ジョブが再開されたことを示します。これは、ジョブの移行によるか、またはqsub(1)コマンドの-rセクションで説明されている理由の1つに起因します。
状態w(aiting)とh(old)は保留中のジョブに対してのみ表示されます。h(old)状態は、qhold(1)、qalter(1)またはqsub(1)-hオプションを使用して保留状態が割り当てられているため、ジョブが現在実行に適格でないこと示すか、またはqsub(1)またはqalter(1)の-hold_jidまたは-hold_jid-adオプションを使用して、ジョブ依存関係が割り当てられたジョブの完了を待機していることを示します。
状態E(rror)は、ジョブのプロパティのために開始できなかった保留中のジョブに表示されます。ジョブのエラーの理由は、qstat(1)-j job_listオプションで示されます。
-
ジョブのサブミッションまたは開始日時
-
ジョブが割り当てられているキュー(実行中のジョブまたはサスペンドされたジョブのみ)
-
-g tが指定されている場合のジョブスロット数またはパラレルジョブタスクの機能
-g tオプションを指定しないと、ジョブによってそれぞれ要求された占有スロットの総数が表示されます。PEスロット範囲要求を伴う保留中のパラレルジョブの場合、想定される将来のスロット割り当てが表示されます。-g tオプションを指定すると、実行中のジョブの機能(MASTERまたはSLAVE - 後者はパラレルジョブのみ)が表示されます。
-
アレイジョブのタスクID
ノンアレイジョブでは空になります。追加情報については、qsub(1)の-tオプションおよび上記の-gを参照してください。
-tオプションを指定した場合、各ステータス行には常に-g tが指定されているかのようにパラレルジョブタスク情報が含まれ、各行には次のパラレルジョブのサブタスク情報が含まれます:
-
パラレルタスクID(パラレルタスクとアレイジョブタスクを混同しないでください)
-
パラレルタスクの状態 - r(unning)、R(estarted)、s(uspended)、S(uspended)、T(hreshold)、w(aiting)、h(old)、またはx(exited)のひとつ
-
CPU、メモリ、I/Oの使用状況
-
パラレルタスクの終了ステータス
-
パラレルタスクの失敗コードとメッセージ
Full Format (with -f and -F)
ヘッダー行に続いて、水平線で区切られた各キューのセクションが提供されます。各キューについて、出力される情報は以下の項目から構成されます。
-
キュー名
-
キュータイプ - B(atch)、I(nteractive)、C(heckpointing)、P(arallel)またはそれらの組み合わせ、またはN(one)の1つ
-
使用されているジョブスロットと使用可能なジョブスロットの数
-
キューホストの負荷平均
-
キューホストのアーキテクチャ
-
キューの状態 - 対応するsge_execd(8)に接続できない場合はu(nknown)、a(larm)、A(larm)、C(alendar suspended)、s(uspended)、S(ubordinate)、d(isabled)、D(isabled)、E(rror)、またはそれらの組み合わせのひとつ。
状態がa(larm)の場合、キュー構成のload_thresholdsリスト(queue_conf(5)を参照)で定義されている負荷しきい値の少なくとも1つ以上が現在超過しているため、それ以上のジョブをそのキューにスケジュールできません。
これに対して、状態A(larm)は、キューのサスペンドしきい値(queue_conf(5)を参照)の少なくとも1つが現在超過していることを示します。これにより、しきい値に違反しなくなるまで、そのキューで実行されているジョブが引き続いてサスペンドされます。
状態s(uspended)とd(isabled)はキューに割り当てられ、qmod(1)コマンドによって解放されます。キューをサスペンドすると、そのキューで実行中のすべてのジョブがサスペンドされます。
状態D(isabled)とC(alendar suspended)は、Univa Grid Engineのカレンダー機能(calendar_conf(5)を参照)を介してキューが自動的に無効またはサスペンドされたことを示し、S(ubordinate)状態は、キューが別のキューへの従属関係を介してサスペンドされたことを示します(詳細はqueue_conf(5)を参照)。(原因を問わず)キューをサスペンドすると、そのキューで実行中のすべてのジョブもサスペンドされます。
キューに対してE(rror)状態が表示された場合、そのホスト上のsge_execd(8)はジョブを開始するために、そのホスト上で実行可能なsge_shepherd(8)を見つけることができませんでした。問題の解決方法については、sge_execd(8)のエラーログファイルを参照してください。後でqmod(1)コマンドの-cオプションを使用してキューを手動で有効にしてください。
キューのインスタンスに対してc(onfiguration ambiguous)状態が表示された場合、これはsge conf(5)のこのキューインスタンスに指定されたコンフィグレーションがあいまいであることを示します。この状態は、構成が再び明確になると消去されます。この状態では、それ以降のジョブがそのキューインスタンスにスケジュールされなくなります。キューインスタンスがc(onfiguration ambiguous)状態に入った理由の詳細は、sge_qmaster(8)メッセージファイルにあり、qstat -explainスイッチで確認できます。この状態のキューインスタンスの場合、クラスターキューのデフォルト設定があいまいな属性に使用されます。
キューインスタンスにo(rphaned)状態が表示されている場合は、現在のクラスターキューの構成またはホストグループ構成によってキューインスタンスが要求されなくなったことを示します。ジョブをまだ終了していないジョブは依然としてキューインスタンスに関連付けられているため、キューインスタンスは保持され、これらのジョブが終了するとqstat出力から消滅します。孤立したキューインスタンスの消滅を早くするために、関連するジョブをqdel(1)を使用して削除することができます。o(rphaned)状態のキューインスタンスは、それをカバーするようにクラスターキュー構成を適切に変更することによって、復活させることができます。この状態では、キューインスタンスへの更なるジョブのスケジューリングができなくなります。
-Fオプションが使用されている場合、リソースの空き情報がキューのステータス行の後に出力されます。各リソース(-Fのオプション引数で選択されたもの、またはオプション引数が省略されている場合はすべてのリソース)に対して、1行が次の形式で表示されます:
-
現在のリソースの利用可能な値が何によって支配されていたかを示す1文字の指定子
`g' - クラスターグローバル
`h' - ホストトータル
`q' - キュー関連のリソース消費
-
現在のリソースの利用可能な値のソースを示す2番目の1文字の指定子
`l' - リソースに対して報告された負荷値
`L' - 管理者定義の負荷スケーリングが適用された後のリソースの負荷値
`c' - consumableリソース機能から得られた利用可能性(complexes(5)参照)
`f' - non-consumable complex属性または固定リソース限度から導出された固定利用可能性定義
-
コロンの後、情報が表示されるリソースの名前
-
等号の後、現在のリソースの利用可能値
表示される利用可能値とそれが派生するソースは、常にすべての可能な組み合わせの最小値です。したがって、例えば、"qf:h_vmem = 4G"の形式の行は、現在キューが4ギガバイトの仮想メモリ内で最大の可用性を有していることを示しますが、この値は固定値(例えば、キュー構成のリソース制限値)で、キュー支配的です。つまり、ホストが合計でこれよりも多くの仮想メモリを使用できるとしても、キューはそれ以上のものを許可しません。逆に、"hl:h_vmem = 4G"という行は、4ギガバイトの仮想メモリの利用可能値の上限を示しますが、その限度は現在ホストに対して報告されている負荷値から導き出されます。そのため、仮想メモリ要件の高いジョブをキューに入れると、このキューが存在するホストは現在4ギガバイトしか使用できません。
-explainオプションが文字'a'または'A'とともに使用される場合、リソースに関する情報が表示されます。これは、負荷しきい値またはサスペンドしきい値に違反します。-Fオプションと同じ書式が、次の拡張で使用されます:
-
行はキーワード`alarm'で始まります
-
リソース値に追加されるのは、適切なしきい値のタイプと値です
キューステータス行(-fの場合)またはリソース利用可能性情報(-Fの場合)の後に、このキューに現在実行されているジョブごとに1行が出力されます。各ジョブのステータス行には以下の項目が含まれます。
-
ジョブID
-
保留中のジョブリスト内のジョブの位置を決定するジョブの優先順位優先度の値は、チケットおよび緊急性ポリシーの設定(sge_priority(5)も参照)に基づいて動的に決定されます。
-
ジョブ名
-
ジョブの所有者名
-
ジョブのステータス - t(ransfering)、r(unning)、R(estarted)、s(uspended)、S(uspended)、T(hreshold)(詳細については、Reduced Format のセクションを参照してください)
-
ジョブのサブミッションまたは開始日時
-
-g tが指定されている場合のジョブスロット数またはパラレルジョブタスクの機能
-g tオプションを指定しないと、ジョブによってそれぞれ要求されたキューごとに占有されているスロットの数が表示されます。PEスロット範囲要求を伴う保留中のパラレルジョブの場合、想定される将来のスロット割り当てが表示されます。-g tオプションを指定すると、実行中のジョブの機能(MASTERまたはSLAVE - 後者はパラレルジョブのみ)が表示されます。
-tオプションを指定すると、各ジョブのステータス行は以下の項目も含まれます。
-
タスクID
-
タスクの状態 - r(unning)、R(estarted)、s(uspended)、S(uspended)、T(hreshold)、w(aiting)、h(old)、またはx(exited)のひとつ(詳細については、Reduced Formatセクションを参照)。
-
CPU、メモリ、I/Oの使用状況
-
タスクの終了ステータス
-
タスクの失敗コードとメッセージ
キューセクションのリストに続いて、ジョブがキューに割り当てられるのを待っている場合に、PENDING JOBSリストが出力されることがあります。待機中の各ジョブのステータス行は、実行中のジョブのステータス行に似ています。相違点は、ジョブのステータスがw(aiting)またはh(old)で、開始時刻ではなくサブミット時刻と日付が表示され、ジョブに対して機能が表示されていないことです。
ごくまれに、例えば、ジョブまたはキュースプールファイルの不整合な状態からsge_qmaster(8)が起動した場合、またはqconf(1)のクリーンキュー(-cq)オプションを使用した場合、qstatは、ジョブを、出力の実行中または保留中のジョブセクションに割り当てることはできません。この場合は、ジョブステータスの不一致(ジョブが実行中のステータスだが、キューに割り当てられていないなど)が検出されたためです。このようなジョブは、出力の最後のERROR JOBSセクションに出力されます。ERROR JOBSセクションは、sge_qmaster(8)を再起動すると消えます。そのようなジョブの原因や影響について不明な点がある場合は、Univa Grid Engineのサポート担当者に連絡してください。
Job Class Format (with -fjc)
ヘッダー行に続いて、水平線で区切られたジョブクラスバリアントのセクションが提供されます。各ジョブクラスバリアントについて、出力される情報は以下の項目から構成されます:
-
ジョブクラスのバリアント名
-
所有権(O) - 実行中のユーザーがジョブクラスの所有者である場合は'X'が表示されます
-
ユーザビリティ(U) - 実行中のユーザーが対応するジョブクラスバリアントから新しいジョブを引き出すことが許可されている場合は、'X'が表示されます。
-
状態
- d(isabled) ジョブクラスバリアントを使用して新しいジョブを作成できない場合
- c(onfiguration conflict) キューがテンプレートジョブクラスの仕様と矛盾している場合
- o(rphaned) ジョブクラスバリアントが削除処理中の場合
さまざまな状態に関する詳細は、sge_job_class((5))を参照してください。
Expanded Format (with -r)
qstatと一緒に-rオプションを指定すると、表示されているジョブごとに以下の情報が出力されます(以下の各ジョブ特性に対して1行ずつ):
-
ジョブとマスタキューの名前
-
qsub(1)-lオプションで指定されたジョブのハードおよびソフトリソース要件。ジョブの緊急度の寄与値を決定する際のリソースごとの加数出力されます(sge_priority(5)も参照)。
-
望まれるキュースロット範囲を含む、要求された並列環境(qsub(1)の-peオプションを参照)
-
ジョブの要求されたチェックポイント環境(qsub(1)-ckptオプションを参照)
-
ジョブを実行している場合、許可されたキュースロット数を使用した、許可された並列環境
-
要求されたジョブバインドパラメータ
Enhanced Output (with -ext)
各ジョブについて、以下の追加項目が表示されます:
ntckts
標準化された形式でのチケットの総数
project
qsub(1)-Pオプションで指定されたジョブが割り当てられているプロジェクト
department
ユーザーが所属する部門(qconf(1)の-sulおよび-suオプションを使用して、現在の部門定義を表示します)
cpu
ジョブの現在の累積CPU使用率(秒単位)
mem
ジョブの現在の累積メモリ使用量(GB秒単位)
io
ジョブの現在の累積IO使用量
tckts
現在そのジョブに割り当てられているチケットの総数
ovrts
qalter(1)の-otオプションによって割り当てられたオーバーライドチケット
otckt
現在そのジョブに割り当てられているチケットの総数のオーバーライド部分
ftckt
現在そのジョブに割り当てられているチケットの総数の機能部分
stckt
現在そのジョブに割り当てられているチケットの総数のうち、共有されている部分
share
ジョブが現在付与されているシステム全体のシェア
Enhanced Output (with -urg)
各ジョブについて、次の追加緊急性ポリシー関連項目が表示されます(sge_priority(5)も参照):
nurg
標準化された形式での、ジョブの合計緊急度値
urg
ジョブの合計緊急値
rrcontr
ジョブ全体のリソース要件に関連する緊急性を反映する緊急度値の寄与
wtcontr
ジョブの待ち時間に関連する緊急性を反映する緊急度値の寄与
dlcontr
ジョブ期限開始時間に関連する緊急性を反映する緊急度値の寄与
deadline
qsub(1)-dlオプションで指定されたジョブの期限開始時刻
Enhanced Output (with -pri)
ジョブごとに、以下の追加ジョブ優先順位関連項目が表示されます(sge_priority(5)も参照):
nurg
標準化された形式でのジョブの緊急度値の合計
npprior
標準化された形式でのジョブの -p 優先順位
ntckts
標準化された形式でのジョブのチケット量
ppri
ユーザーが指定したジョブの -p 優先順位
ENVIRONMENTAL VARIABLES
SGE_ROOT
Univa Grid Engineの標準設定ファイルの場所を指定します。
SGE_CELL
設定されている場合、デフォルトのUniva Grid Engineセルを指定します。Univa Grid Engineセルに対処するために、qstatは(優先順位の順に)以下の項目を使用します:
-
設定されている場合、環境変数SGE_CELLで指定されているセルの名前
-
デフォルトのセルの名前、すなわち、default
SGE_DEBUG_LEVEL
設定されている場合、デバッグ情報をstderrに書き込むように指定します。さらに、デバッグ情報が生成される詳細レベルが定義されます。
SGE_QMASTER_PORT
設定されている場合、sge_qmaster(8)が通信要求を待機すると予想されるtcpポートを指定します。ほとんどのインストールは、そのポートを定義する代わりに、サービス"sge_qmaster"のサービスマップエントリを使用します。
SGE_LONG_QNAMES
qstatは、最大30文字のキュー名を表示します。それが多すぎるか不十分であれば、この変数でカスタムの長さを設定できます。最小表示長は10文字です。最良の表示長が分からない場合は、SGE_LONG_QNAMESを-1に設定しますと、qstatが最適な長さを決定します。
SGE_LONG_JOB_NAMES
qstatはジョブ名を最大10文字まで表示します。それで十分でない場合は、この変数を使用してカスタムの長さを設定できます。最小表示長は10文字です。最良の表示長がわからない場合は、SGE_LONG_JOB_NAMESを-1に設定しますと、qstatが最適な長さを決定します。
FILES
<sge_root>/<cell>/common/act_qmaster
Univa Grid Engine master host file
<sge_root>/<cell>/common/sge_qstat
cluster qstat default options
$HOME/.sge_qstat
user qstat default options
SEE ALSO
sge_intro(1), qalter(1), qconf(1), qhold(1), qhost(1), qmod(1), qsub(1), queue_conf(5), session_conf(5), sge_execd(8), sge_qmaster(8), sge_shepherd(8).
COPYRIGHT
See sge_intro(1) for a full statement of rights and permissions.
Univa Grid Engine User Commands UGE 8.5.4 QSTAT(1)