websam glance+pak, glanceplus のご紹介...対して、glance+pak...
TRANSCRIPT
1 © NEC Corporation 2017 NEC Group Internal Use Only
2018年5月日本電気株式会社
WebSAM Glance+Pak, GlancePlus のご紹介(概要説明資料)
2 © NEC Corporation 2017 NEC Group Internal Use Only
はじめに
▌WebSAM Glance+Pak, WebSAM GlancePlus製品は本資料(概要説明)以外にも詳細説明、ファーストステップガイドなどご用意しております。
▌社内の方はMIP-KMの関連資料から、社外の方は弊社営業を経由し各資料をご参照いただけますようお願いいたします。
3 © NEC Corporation 2017 NEC Group Internal Use Only
目次
▌製品を知る
• WebSAM Glance+Pak / WebSAM GlancePlus とは
• WebSAM GlancePlus について
• Micro Focus Performance agent software について
▌他性能測定ツールとの違いを知る
• 性能測定・監視ができるその他のアプリケーションとの違い
• Glance+Pak と SystemManager に見る性能情報のサポート範囲の違い
▌Glance+Pak を使用した実例を見る• 実例1:ファイルシステムがフルになった原因を知りたい
• 実例2:CPU 負荷発生の原因を知りたい
• 実例3:プロセスのシステムコールの実行状況を知りたい
• 実例4:kthread: table is full の発生原因を知りたい
• 実例5, 6:プロセスに対する設定変更前後の CPU, メモリなどの性能情報を比較したい
4 © NEC Corporation 2017 NEC Group Internal Use Only
目次
▌製品の利用、導入に関する情報について
• 利用イメージ、システム構成イメージ
• 価格情報
• 参考URL
5 © NEC Corporation 2017 NEC Group Internal Use Only
WebSAM Glance+Pak / WebSAM GlancePlus とは
▌WebSAM Glance+Pak(以降、Glance+Pak) は、以下の2つのソフトウェアが
セットになった製品です。
・ WebSAM GlancePlus (以降、GlancePlus)
・ Micro Focus Performance agent software (以降、PA)
▌GlancePlus は単品製品です。
▌Glance+Pak / GlancePlus は共に、インストールマシンの CPU,メモリ、
ディスク、LVM、ファイルシステム、ネットワークインターフェイス、プロセス単体の
システムコールなどの性能情報を収集する機能を有した製品です。
▌NEC では、Glance+Pak、 GlancePlus の2つの製品を出荷・販売・保守サポート
しています。
6 © NEC Corporation 2017 NEC Group Internal Use Only
GlancePlus について
▌GlancePlus は、パフォーマンスの監視、診断をリアルタイムで行うソフトウェアです。
▌OS が提供しているツール(標準ツール)では入手することができない細かな性能情報を提供します。
▌測定した性能情報は、CUI, Motif GUI で表示することができます。
▌システム状況の調査、パフォーマンスボトルネックの特定、より効率的な運用のためのシステムチューニングをお手伝いできます。
【CUI版 glance の表示例】 【GUI版 xglance の表示例】
7 © NEC Corporation 2017 NEC Group Internal Use Only
PA について
▌性能情報をファイルに蓄積することにより過去のトレンドを分析するツールです。
▌ファイルに蓄積した性能情報は、製品が提供するコマンドを用いて、CSV 形式、ワークシート形式などのファイルに出力することができます。
▌収集した性能情報を元に、あらかじめ設定しているしきい値条件をあてはめ、条件に合致した場合に、しきい値超過のアラームを syslog ファイルへ出力する等の通知を行うことができます。
▌任意のユーザプロセスをアプリケーションとして登録することで、そのプロセスに特化した性能情報を蓄積することができます。
▌画面を持たないデーモンの状態で動作します。
※備考
Micro Focus Performance manager software(別売り) を用いることで、 PA が蓄積しているファイルにアクセスし Manager 上で性能情報を元にした様々なグラフを表示させることや、蓄積しているデータからその情報に関する将来の使用状態等の予測をおこなうこともできます。
GlancePlusでも「glance adviser 機能」を用いて指定する測定項目のみの性能情報を収集・蓄積することは可能です。本機能に関しては詳細説明編をご参照ください。
多数の測定項目に関する性能情報を収集・蓄積しておきたい場合はGlance+Pakをご購入いただき、PAも一緒に使われることを推奨いたします。
8 © NEC Corporation 2017 NEC Group Internal Use Only
▌サービスインに向けた事前検証
▌通常運用時
▌障害発生時
▌運用変更、アプリケーション追加などのシステム変更
Glance+Pak ご利用イメージ
正常稼働中
障害発生中
しきい値監視など定期的に状況確認
サービスイン
log
蓄積情報の解析より詳細なメトリック収集
本番用 検証用 検証用 本番用 検証用
反映
App 1
App 2
App 3
アラーム
障害解消正常稼働中
安定して正常稼働中
App 1 App 2
システム,アプリ,プロセスごとに分析しチューニング
9 © NEC Corporation 2017 NEC Group Internal Use Only
性能測定・監視ができるその他のアプリケーションとの違い
NECでは、以下の3つの製品を性能測定・監視ツール(アプリケーション)として販売しています。
ESMPRO/SA や SystemManager は、Manager – Agent 構成を基本とし、各 Agent 在中のサーバよりCPU,メモリ、ディスクといった性能監視に必要な情報を取得しています。
Glance+Pak はサーバ毎に単独にインストールし、障害調査時にも備えるため ESMPRO/SA や SystemManager では提供していないサーバの詳細な性能情報を取得しています。
また、取得した詳細な性能情報を活用し、サーバリソースのチューニングや障害発生時の調査のお役にたちます。
ESMPRO/ServerAgent(ESMPRO/SA)
WebSAM SystemManager(SystemManager)
Glance+Pak
サポートOS Linux, Windows(Manager は Express サーバのみ)
HP-UX, AIX, Solaris, Linux, Windows HP-UX, Linux
構成 Manager ⇔ Agent Manager ⇔ Agent サーバへの単独インストール
特徴 Manager を介して Agent 在中の複数のサーバより、CPU 負荷監視、メモリ監視、ディスク監視、LAN のトラフィック状況の監視、採取情報をグラフ描画が可能
Manager を介して Agent 在中の複数サーバより、CPU監視、メモリ監視、ディスク監視、プロセス監視、LANのトラフィック状況の監視、採取情報のグラフ描画が可能
Glance+Pak がインストールされているサーバより、CPU監視、メモリ監視、ディスク監視、ファイルシステム監視、LVM監視、プロセス監視、スレッド監視、システムコール監視が可能
価格 Express サーバには無償添付 導入規模に依存(1AG \60,000~) マシンのモデル(ランク)に依存
該当する導入環境 Express サーバに Manager 環境を用意でき、プロセス監視が不要でチューニングや分析も不要な場合
Express サーバ、もしくは他社製サーバに Manager 環境を用意し、CPUやメモリといった基本的な性能情報の監視やプロセス監視が必要だが、チューニングや分析が不要な場合
サーバリソースの細部に渡る性能情報の収集を行い障害発生時の解析に役立てる場合チューニングや分析に必要な性能の情報の収集が必要な場合
※ ESMPRO/SAやSystemManagerで基本的なサーバリソースの監視・通報を行い、その監視・通報に対してGlance+Pak を使い詳細に性能情報を確認する運用の実例あり
10 © NEC Corporation 2017 NEC Group Internal Use Only
Glance+PakとSystemManagerに見る性能情報のサポート範囲の違い
下記の表は、SystemManager(背景色:緑)とGlance+Pak(背景色、枠色:赤)で各性能情報に対してサポートしている範囲を示しています。
※SystemManager と Glance+Pak の使い分けについて。
通常のサーバ監視では、Manager – Agent 構成で広く浅く俯瞰的に監視する SystemManager を使用することを推奨します。
対して、Glance+Pak は例えば障害が発生したサーバにおいて広く深く(より詳細な)情報を収集することで障害調査のお役にたつことができます。 特に上記の表にある、LVM, プロセス単位, システムコール に関する性能情報の取得は Glance+Pak でのみ取得可能です。
CPU
User %
System %
I/O Wait %
Total %
Interrupt %
Idle %
CPU Queue
etc.
メモリ
Memory %
Read Cache Hit %
Write Cache Hit %
User %
System %
Cache %
Mem Queue
etc.
スワップ
Swap %
Swap size
Swap Out
Used Swap %
Swap Dev %
Swap FS %
etc.
ディスク
Peak disk %
Disk IO Rate
Disk IO Block Rt
Disk Wait Time
Phys IO Rate
Log IO Rate
Disk Queue
etc.
ファイルシステム
FS Space %
FS Size
FS Phys IO Rt
FS Phys Read Rt
FS Phys Write Rt
FS Log IO Rt
FS Log Read Rt
etc.
LVM
LV Read Rate
LV Write Rate
LV Read KB Rt
LV Write KB Rt
ネットワーク
IN Packet Rt
OUT Packet Rt
ERR Packet Rt
COLL Packet Rt
Network %
IN KB Rate
OUT KB Rate
etc.
プロセス
CPU %
Phys IO Rt
Process Stop
Reason
RSS Memory
VIRT Memory
Memory Region
Open Files
etc.
システムコール
GBL Syscall Name
GBL Syscall Count
GBL Syscall CPU Time
PROC Syscall Name
PROC Syscall Count
PROC Syscall Rate
PROC Total Time
etc.
採取可能な性能情報の項目
採取可能な性能情報の種類
11 © NEC Corporation 2017 NEC Group Internal Use Only
製品使用の実例(こんな時こそ Glance+Pak が、お役にたちます)
以降のスライドでは、実際にお客様環境で発生した障害事象に対して原因調査のため Glance+Pak を用いた幾つかの事例を紹介します。
ここで紹介する事例については、発生した障害事象に対して、
- OS で提供しているコマンドを用いて調査を行う場合、複数のコマンドを使い分けて情報採取を行う必要があります。
そのため目的の情報を得るまでに時間がかかってしまいます。(1つのコマンドで一度の測定で目的の情報を得るということが困難なケースの方が多い。)
- ESMPRO/SA や SystemManager で提供している性能情報中から、目的の情報を得ることが難しい。
という課題に対して、Glance+Pak を使うことにより目的の情報が取得できたという事例を紹介しています。
(主に Glance+Pak に含まれる GlancePlus を用いた事例を紹介しています。)
12 © NEC Corporation 2017 NEC Group Internal Use Only
【事例1】ファイルシステムがフルになった原因を知りたい
■実例
HP-UX サーバで Filesystem is full の事象が発生しました。
ファイルサイズの大きな不要ファイルを全て削除しましたが、bdf の出力結果では期待したほどのファイル使用量の減少が見られませんでした。
調査の過程で、プロセスが open(2) しているファイルを削除(unlink(2))した場合、そのファイルの内容は close(2) するまではファイルシステムから消去されない仕様であることが分かりました。
そのため、ファイルシステムの使用量を減らして bdf, df コマンドの出力に反映させるためには、ファイルをオープンしている全てのプロセスがファイルをクローズさせる必要が分かりました。削除対象となるファイルをオープンしているプロセスを確認したいです。
■GlancePlus の使用例
GlancePlus ではプロセスがオープンしているファイルを確認することができます。
この機能を用いることで、削除対象ファイルをオープンしているプロセスを特定することができます。
【glance : PROCESS OPEN FILE の画面より】
プロセスがオープンしているファイル名とパス、ファイルタイプ、オープンモードなどの情報が一目で確認することができます。
13 © NEC Corporation 2017 NEC Group Internal Use Only
【事例2】CPU 負荷発生の原因を知りたい
■実例
サーバで CPU 負荷(CPU 待ちによる負荷)が発生しました。
調査の過程で、CPU 待ちは主に CPU 使用率が高い場合、またディスク I/O が高い状態の場合に発生することが分かりました。
まずは、このような状態を招いているプロセスを特定したいです。
■GlancePlus の使用例
GlancePlus の PROCESS LIST 画面を CPU 使用率の高い順、ディスク I/O の高い順とそれぞれソートして表示させることで、
CPU使用率の高いプロセス、 ディスク I/O の高いプロセスを1つの画面上で素早く確認することができます。
PROCESS LIST 画面を CPU 使用率の高い順にソートした例 PROCESS LIST画面をディスク I/O の高い順にソートした例
14 © NEC Corporation 2017 NEC Group Internal Use Only
【事例3】プロセスのシステムコールの実行状況を知りたい
■実例
アプリケーションのサービス異常を調査するため、プロセスで発行しているシステムコールの情報を確認したいです。
■GlancePlus の使用例
GlancePlus では測定対象プロセスがあらかじめ分かっていれば、そのプロセスのシステムコールに関する性能情報を表示させることができます。
GlancePlus を使えば対象プロセスがいつ、どのようなシステムコールを発行したのか正確に把握することができます。
【glance : PROCESS SYSTEM CALLS の画面より】
プロセスの各システムコールの実行回数、1秒あたりの実行回数、システムコール中の経過時間などの状況が確認できます。
<ポイント>GlancePlus ならば、tusc や strace 等のシステムコール採取コマンドを実行しなくてもシステムコールに関する性能情報が簡単に表示できます。(システム全体からみたシステムコールの性能情報も表示することができます。)
15 © NEC Corporation 2017 NEC Group Internal Use Only
【事例4】 kthread: table is full の発生原因を知りたい
■実例
サーバで vmunix: kthread: table is full が出力され調査の必要があります。“vmunix: kthread: table is full” は、システム上で動作するスレッド数がカーネルパラメータ : nkthread に達した場合に出力されます。
この状態になった場合に想定される影響としては、システム上で動作するスレッド数の上限に達しているため、システム上で新しい
スレッドを生成したり、新しいプロセスを fork することができなくなります。
原因調査のため、はじめにプロセス毎のスレッド数を把握したいです。
■GlancePlus の使用例
GlancePlus は、プロセスのスレッド数を proc_thread_count というメトリックで提供しています。
GlacnePlus の glance adviser 機能を用いれば、proc_thread_count に対して条件を指定して、その条件以上の proc_thread_count の
値が高いプロセスのみを出力することができます。
それにより、大量にスレッドを生成しているプロセスを特定することができます。
定義文の読込
【 glance adviser 定義文サンプル】headers_printed = headers_printed
if ( headers_printed == 0 ) then {
print "Date,Time,PID,Proc Name,Thrd Cnt"
headers_printed = 1
}
process loop {
if proc_thread_count > 100 then {
print gbl_statdate,",",
gbl_stattime,",",
proc_proc_id,",",
proc_proc_name,",",
proc_thread_count
}
}
GlancePlus[ glance adviser 機能]
【 glance adviser 出力結果サンプル】Date ,Time , PID,Proc Name ,Thrd Cnt
09/22/2014,09:23:58, 44,lvmp_wk_th_d , 101
09/22/2014,09:23:58, 14306,mthread , 301
09/22/2014,09:24:03, 44,lvmp_wk_th_d , 101
09/22/2014,09:24:03, 14306,mthread , 301
: : : : :
実行結果の出力
<ポイント>プロセスのスレッド数が確認できるのは GlancePlus だけです!
16 © NEC Corporation 2017 NEC Group Internal Use Only
【事例5】プロセスに対する設定変更前後の CPU、メモリなどの性能情報を比較したい(PA 編)
■実例
この度、ある業務プロセスの設定変更を行うことになりました。設定の変更前と変更後でそのプロセスの CPU 使用率、メモリ使用率、ディスク I/O の変化を比較したいです。
■PA の使用例
PA ではプロセスを任意のアプリケーションとして設定ファイル(parmファイル)へ登録することができます。
登録したアプリケーションはアプリケーション専用のメトリックにより性能情報を蓄積することができます。
事前に対象プロセスを PA にアプリケーション登録しておけば、設定変更作業完了後にアプリケーションの性能情報を抽出することで、設定前後の CPU使用率、メモリ使用率、Disk I/O の容易に比較することができます。
【PA アプリケーションの性能情報抽出までのイメージ】
対象となるユーザプロセスを User-A とします。
1) User-A を PA に対してアプリケーション : user-process-A として登録します。
2) PA でアプリケーションの性能情報の蓄積を開始します。
3) ユーザプロセスの設定変更作業を開始します。
4) ユーザプロセスの設定変更作業を終了します。
5) PA 登録しているアプリケーションの性能情報を抽出します。
アプリケーション : user-process-A として、ユーザプロセスの
設定変更前から変更後までの性能情報が出力できます。
※PA のアプリケーションの性能情報には、アプリケーションとして
CPU使用率 : APP_CPU_TOTAL_UTIL
メモリ使用率 : APP_MEM_UTIL
ディスク I/O : APP_DISK_PHYS_IO
といったメトリックが提供されています。
17 © NEC Corporation 2017 NEC Group Internal Use Only
【事例6】プロセスに対する設定変更前後の CPU、メモリなどの性能情報を比較したい(GlancePlus 編)
■実例
プロセスの設定変更を行うことになりました。設定の変更前と変更後でそのプロセスの CPU 使用率、メモリ使用率、ディスク I/O の変化を比較したいです。
■GlancePlus の使用例
前述の PA 編で測定対象となるプロセスを任意のアプリケーションとして設定ファイル(parmファイル)に登録しました。
この parm ファイルを GlancePlus も参照しており、APPLICATION LIST 画面で登録アプリケーションの性能情報を確認することができます。
設定変更作業を行う前から GlancePlus でアプリケーションの情報を表示させておけば、プロセスの設定変更作業の実施前後の CPU使用率、物理/仮想メモリの使用量など比較することができます。
<ポイント>glance ならば、任意の1つのまたは複数のプロセスを1つの(測定用)アプリケーションとして登録することができます。
18 © NEC Corporation 2017 NEC Group Internal Use Only
▌GlancePlusがログインされているサーバに直接ログイン。
▌別サーバ上のGlancePlusからリソース情報を参照することができます。
システム構成イメージ
GlancePlus
GlancePlusperfd
GlancePlus
GlancePlus
GlancePlus
perfd
perfd
perfd
TCP
TCP
TCP
ネットワーク
※Ver 5.00以降で追加されたperfd機能を使用します。
19 © NEC Corporation 2017 NEC Group Internal Use Only
GlancePlus の実績と優位性
▌GlancePlus は性能分析ツールとして、HP-UX で高い導入実績を誇っています。
デファクトスタンダードとして認知され、導入されています。
NEC の NX サーバにおいては、多くのお客様で使用しています。
▌ Linux においても Mission Critical システムにて導入実績あり
今後も Express5800, NX7700x シリーズ向けに広く販売していきます。
▌業務 AP/PKG のリソースを性能分析するための SE 必須ツール
GlancePlus 1つで、各種機能を使い分けることが可能であり、総合テスト等で、性能分析/リソース使用状況を確認するための使用に適しています。
例えば、プロセス単位でのシステムコールの発行状態、オープンしているファイルの確認、メモリ領域
の使用状況などが確認できます。
将来的に発生する障害に結びつく兆候がないかを調べることができます。
障害発生時には、原因特定のために蓄積している多彩な項目の分析に使用することができます。
▌ トラブルを未然に防止し、万が一の障害発生時にも SE が性能分析し、早期解決することが可能。
20 © NEC Corporation 2017 NEC Group Internal Use Only
価格
製品名 希望小売価格
WebSAM GlancePlus-L(T0) 140,000
WebSAM GlancePlus-L(T1) 175,000
WebSAM GlancePlus-L(T2) 379,000
WebSAM GlancePlus-L(T3) 1,231,000
WebSAM GlancePlus-L(T4) 1,590,000
WebSAM GlancePlus-CM 26,000
製品名 希望小売価格
WebSAM Glance+Pak-L(T0) 172,000
WebSAM Glance+Pak-L(T1) 287,000
WebSAM Glance+Pak-L(T2) 794,000
WebSAM Glance+Pak-L(T3) 1,842,000
WebSAM Glance+Pak-L(T4) 2,651,000
WebSAM Glance+Pak-CM 26,000
WebSAM GlancePlus WebSAM Glance+Pak
▌製品のライセンスはマシンモデルのランク(Tier)により分かれています。
Tier については次ページの問い合わせ先へご確認ください。
21 © NEC Corporation 2017 NEC Group Internal Use Only
製品問合せ先/参考URL
▌製品に関する問合せ先
(社内)https://www.intra.nec.co.jp/WebSAM/inquiry
(社外)http://jpn.nec.com/websam/contact.html
▌Webページ
(社内)https://www.intra.nec.co.jp/HP_GlancePlus/
(社外)http://jpn.nec.com/websam/glanceplus/index.html
本製品はマイクロフォーカス社のライセンスに基づく製品です。Copyright © 2017 Micro Focus. All rights reserved. Micro Focus/マイクロフォーカス、そのロゴおよび製品は、
英国、米国またはその他の国におけるMicro Focusまたはその子会社もしくは関連会社の商標または登録された商標です。その他のマークはすべてそれぞれの権利者の財産です。