zabbix, prometheus · zabbix? it インフラやサービス、アプリケーションの可用性...
TRANSCRIPT
![Page 1: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/1.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 1
OSS 監視ソフトウェア Zabbix, Prometheus
のご紹介
![Page 2: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/2.jpg)
自己紹介
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 2
名前: 盛 宣陽(Yoshiharu Mori)
所属:SRA OSS,Inc.日本支社
基盤技術グループ
職務内容:
PostgreSQL以外のOSS全般のサポートやミドルウェアの構築、コンサルティング
グループ統括
![Page 3: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/3.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 3
内容
1. Zabbixについて
2. Prometheusについて
3. Zabbix と Prometheus の連携 監視メトリックス編
4. Zabbix と Alertmanager の連携 通知の集約編
![Page 4: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/4.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 4
![Page 5: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/5.jpg)
Zabbix?
IT インフラやサービス、アプリケーションの可用性や性能を監視するためのエンタープライズ向け統合監視ソフトウェア
オープンソースソフトウェアとして開発されており、無料で利用可能
開発元はラトビア共和国の Zabbix LLC.
最新バージョンは 4.0(安定版、LTS)と 4.4(ポイントリリース)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 5
![Page 6: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/6.jpg)
Zabbixのアーキテクチャ
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 6
![Page 7: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/7.jpg)
監視メトリックス
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 7
SNMP
ICMP
HTTPWEB
SSH
Telnet Java (JVM)
DB
エージェント監視 エージェントレス監視
VMware
![Page 8: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/8.jpg)
障害検知
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 8
2019 05/14 09:13:25 [INFO] … 2019 05/14 09:15:10 [ERR] …
2019 05/14 09:21:47 [INFO] …
閾値
異常値 予測値
文字列
![Page 9: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/9.jpg)
アラート通知
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 9
メッセージ
• SMS
• アラートスクリプト リモートコマンド
• SSH、Telnet
• IPMI
• カスタムスクリプト
![Page 10: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/10.jpg)
ビジュアリゼ―ション
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 10
![Page 11: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/11.jpg)
ネットワークディスカバリ
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 11
…
:監視対象に 追加
:監視対象か ら削除
• 探索対象
• IP アドレス
• サービス(FTP、SSH、
HTTP、SNMP、
etc.)
• Zabbix agent
• アクション
• 監視対象の追加・削除
• メトリクスの追加・削除
• スクリプトの実行
ネットワークを探索し
自動でアクションを実行
![Page 12: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/12.jpg)
ローレベルディスカバリ
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 12
• CPU
• ファイルシステム
• ネットワークインタフェース
• SNMP OID
• Windows サービス
発見されたデバイスに対して
自動的に監視を開始
…
:監視対象 に追加
:監視対象か ら削除
![Page 13: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/13.jpg)
Prometheus ?
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 13
![Page 14: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/14.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 14
Prometheus?
メトリックスベースのモニタリングシステム
Apache ライセンス 2.0
Cloud Native Computing Foundationで開発・メンテナンス
CNCFの目的
オープンソースでベンダー中立プロジェクトのエコシステムを育成・維持して、このパラダイムの採用を促進したいと考えてます。
私たちは最先端のパターンを民主化し、これらのイノベーションを誰もが利用できるようにします。
![Page 15: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/15.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 15
成熟度
6プロジェクト
17プロジェクト
15プロジェクト
![Page 16: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/16.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 16
Prometheusサーバ
scraping
evaluation
WEB API
discovery
監視対象
exporter
Alertmanager
Prometheus
WEB UI
AWS EC2 Azure
GCP GCE Kubernetes
OpenStack
DNS
監視対象の自動登録
File
Prometheusのアーキテクチャ
HTTP PromQL
HTTP Push
通知 可視化
Pushgateway
バッチジョブ
HTTP Pull metrics
HTTP PUSH
![Page 17: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/17.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 17
サーバとexporterについて
exporter メトリックスを収集するエージェント
収集したいメトリックスごとにexporterを導入 Ex) http,postgresql,node
各exporterは異なるポート番号でHTTPリクエスト を待ち受け
Prometheusサーバ
scraping
evaluation
WEB API
discovery
監視対象
exporter Pushgateway
バッチジョブ
HTTP Pull metrics
HTTP PUSH exporter側の設定で公開するメトリックスを定義
Prometheusサーバは定期的にHTTPリクエストを発行してexporterで公開されているメトリックスを収集
![Page 18: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/18.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 18
exporterの種類
![Page 19: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/19.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 19
Prometheusサーバ
scraping
evaluation
WEB API
discovery
監視対象
exporter
サーバとPushgateway
Pushgateway
バッチジョブ
HTTP Pull metrics
HTTP PUSH
メトリックスをPUSHしたい場合に利用
バッチジョブ等の実行結果をPushgatewayにPUSH
PushgatewayではPUSHされた最新値を保存
PrometheusサーバからはPushgatewayに対してデータをPULLする
Prometheusサーバに対して直接メトリックスをPUSHできない
サーバはメトリックスをPullするだけ → 安定性に貢献
![Page 20: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/20.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 20
Prometheusサーバ
scraping
evaluation
WEB API
discovery
Prometheus
WEB UI
WEB UI と PromQL
HTTP PromQL
可視化
PrometheusサーバがWEB UIを提供しているが1度きりのグラフ作成
ダッシュボードとしてはGrafanaを利用
GrafanaはHTTPを利用してサーバから メトリックスを取得
PromQLでデータの選択、集計
多数から絞り込んで少数のデータを参照 例) パーティションの利用率を知りたい part_usage → 各パーティションの利用率 (/,/var,/home,/data) part_usage{part=‘/var’} → /varの利用率
![Page 21: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/21.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 21
Prometheusサーバ
scraping
evaluation
WEB API
discovery
AWS EC2 Azure
GCP GCE Kubernetes
OpenStack
DNS
監視対象の自動登録
File
ディスカバリ 自動登録
定期的にPrometheusがサービスディスカバリを行い監視対象を自動登録
EC2のインスタンスのディスカバリを行う設定 - job_name: ‘ec2sd' ec2_sd_configs: - region: xxx access_key: yyy secret_key: zzz port: 9100
![Page 22: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/22.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 22
Prometheusサーバ
scraping
evaluation
WEB API
discovery
Alertmanager
評価と通知
HTTP Push
通知
Scraping処理とは別処理でメトリックスの評価
PromQLによりメトリックに対して計算式を定義し新たなメトリックスを定義することもできる
Alertmanagerが受け取ったデータはラベルが定義されており、 ラベル別に整理、集約ができる
ラベル“service”:”database”があるアラートは管理者に通知 ラベル“env”:”staging”は通知を行わない ラベル“alertname”:”httpd_down”のアラートは5分ごとにまとめてWEB管理者へ通知
閾値を定義してAlertmanagerにHTTPでPush
![Page 23: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/23.jpg)
3.Zabbix x Prometheusとの連携 監視メトリックスの連携
対象:Zabbix 4.2以降
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 23
X
![Page 24: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/24.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 24
Zabbix 4.2からの新機能
アイテムの保存前処理で Prometheus との連携が可能に
![Page 25: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/25.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 25
exporter から metrics を取得
HTTP exporter
メトリクス名{ラベル名=“ラベル値”,…} メトリクス値
Prometheus の metrics を HTTP エージェントで 取得・解析可能に
![Page 26: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/26.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 26
exporterの種類
Zabbixで使える!
![Page 27: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/27.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 27
PushgatewayもExporterとして機能
Pushgateway
バッチジョブ
HTTP PUSH
cat <<EOF | curl --data-binary @- http://pushgateway.example.org:9091/metrics/job/some_job/instance/some_instance # TYPE some_metric counter some_metric{label="val1"} 42 # TYPE another_metric gauge # HELP another_metric Just an example. another_metric 2398.283 EOF
Pushgatewayとの連携
![Page 28: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/28.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 28
Prometheus Federationとの連携
Federation Prometheusサーバ自身がExporterとして機能
Prometheus
サーバ
Prometheus
サーバ
Prometheus
サーバ
HTTP エージェント
オンプレ-クラウド/コンテナ基盤との連携-部分参照
Prometheusサーバ
Prometheus
サーバ
![Page 29: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/29.jpg)
4. Zabbix と Alertmanagerの連携 通知の集約
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 29
X 対象: Zabbix 3.2(障害の手動クローズ) 以降
![Page 30: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/30.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 30
Alertmanagerが受信するデータ 1
[障害発生] PrometheusサーバからAlertmanager(AM)へ次の形式のデータをPOST
[ { "labels":
{ “alertname”: “<requiredAlertName>”,
“<labelname>”: “<labelvalue>”,
...
},
"annotations":
{ "<labelname>": "<labelvalue>", },
“startsAt”: “<rfc3339>”,
“endsAt”: “<rfc3339>”,
"generatorURL": "<generator_url>"
}]
青文字:省略可
赤文字:必須
緑文字:自由定義
Labelsの内容が変わると違う通知データと解釈
![Page 31: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/31.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 31
Alertmanagerが受信するデータ 2
[障害復旧] PrometheusサーバからAlertmanager(AM)へ次の形式のデータをPOST
[ { "labels":
{ “alertname”: “<requiredAlertName>”,
“<labelname>”: “<labelvalue>”,
...
},
"annotations":
{ "<labelname>": "<labelvalue>", },
“startsAt”: “<rfc3339>”,
“endsAt”: “2019-07-04T09:28:21.835576682+09:00”,
"generatorURL": "<generator_url>"
}]
青文字:省略可
赤文字:必須
緑文字:自由定義
endsAtで指定した時刻に、同じlabelsのイベントが復旧する
![Page 32: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/32.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 32
ZabbixとAlertmanagerの連携 1
[障害発生] ZabbixのアクションからcurlでPOST
[{
"labels":{
"alertname":"{EVENT.NAME}",
"hostname":"{HOST.NAME}",
"severity":"{EVENT.SEVERITY}",
“evnetid":"{EVENT.ID}",
"itemkey":"{ITEM.KEY}",
},
"annotations":{ "lastvalue":"{ITEM.VALUE}“ },
"generatorURL":
"http://ZabbixURL/zabbix/tr_events.php?triggerid={TRIGGER.ID}&eventid={EVENT.ID}"
}]
EVENT.IDを渡すことで labelsがユニークになる
ITEM.VALUEなど変動する値はannotaionsに入れる
Zabbixのマクロを利用
![Page 33: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/33.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 33
ZabbixとAlertmanagerの連携 2
[障害復旧] 復旧時のアクションからPOST
[{
"labels":{
"alertname":"{EVENT.NAME}",
"hostname":"{HOST.NAME}",
"severity":"{EVENT.SEVERITY}",
“evnetid":"{EVENT.ID}",
"itemkey":"{ITEM.KEY}",
},
"annotations":{ "lastvalue":"{ITEM.VALUE}“ },
”endsAt”:”アクション発報時刻を埋め込む”,
"generatorURL":
"http://ZabbixURL/zabbix/tr_events.php?triggerid={TRIGGER.ID}&eventid={EVENT.ID}"
}]
![Page 34: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/34.jpg)
設定の詳細
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 34
https://www.sraoss.co.jp/event_seminar/2019/zabbix20190710seminer.pdf
![Page 35: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/35.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 35
通知 時系列
時間
Alertmanager
Labels{“alertname”:“DBエラー","hostname":”server1“,”eventid”: “X”}
X=1 X=2
group_wait
X=1 X=2
X=3 X=4
group_interval
X=1 X=2 X=3 X=4
Zabbixから発行された通知
メール送信された内容
障害 復旧
1通目 2通目
![Page 36: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/36.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 36
時間
Alertmanager
Labels{“alertname”:“DBエラー","hostname":”server1“,”eventid”: “X”}
X=3 X=4
group_interval
X=1 X=2 X=3 X=4
Zabbixから発行された通知
メール送信された内容
X=1 X=5
X=2 X=3 X=4 X=5 X=1
group_interval
障害 復旧
2通目 3通目
![Page 37: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/37.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 37
時間
Alertmanager
Labels{“alertname”:“DBエラー","hostname":”server1“,”eventid”: “X”}
group_interval
Zabbixから発行された通知
メール送信された内容
X=1 X=5
X=2 X=3 X=4 X=5 X=1
group_interval
X=2 X=3 X=4 X=5
障害 復旧
X=2 X=3 X=4 X=5
3通目 4通目
![Page 38: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/38.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 38
実際のメール内容
Zabbixのイベント障害画面へ
AlertManagerのUIへ
![Page 39: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/39.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 39
通知のSilence(ミュート)機能
AlertmanagerのUIから通知の抑止ができる
指定時間内に特定のラベルがある場合には通知をしない
![Page 40: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/40.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 40
Alertmanager クラスタ
Alertmanager
Alertmanager
互いのAlertmanagerが連携して通知を抑止
Labelsの内容が同じであれば同じ通知データ
![Page 41: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/41.jpg)
比較とまとめ
Zabbix
監視設定はサーバで管理
Agentで値の取得
Zabbix APIによる監視設定
ログ監視を標準でサポート
WEB監視を標準でサポート
通知でスクリプトが実行が可
専用の管理画面
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 41
Prometheus
監視内容ごとにExporterをインストールして監視値を設定
クラウド・コンテナ環境のディスカバリ機能がビルトイン
マネージャー間連携ができる
通知の集約ができる
通知のミュートができる
まとめ
ZabbixとPrometheusの連携して効率的な監視ができる
![Page 42: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/42.jpg)
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 42
申し込み先: Zabbix社
https://enterprise.zabbix.co.jp/events/12241
![Page 43: Zabbix, Prometheus · Zabbix? IT インフラやサービス、アプリケーションの可用性 や性能を監視するためのエンタープライズ向け統合 監視ソフトウェア](https://reader030.vdocuments.mx/reader030/viewer/2022040208/5e2bb3c7fe394c05fe259417/html5/thumbnails/43.jpg)
ご清聴ありがとうございました
Copyright © 2019 SRA OSS, Inc. Japan All rights reserved. 43