クラウド時代の運用・監視2013 aws利用検討開始 2014 店舗実験システム...
TRANSCRIPT
Copyright (c) 2017 Lawson, Inc. All rights reserved. 1
クラウド時代の運用・監視~ システムを「視て」 ビジネスを「知る」 ~
株式会社ローソン
業務システム統括本部 / システム基盤部 / マネジャー
進藤 広輔
Copyright (c) 2017 Lawson, Inc. All rights reserved. 2
Agenda
1皆様に支えられています!
会社紹介
2日々これAWSなり!
AWSとローソンの歴史
3AWSの検討・利用が1段落してみて・・・
AWSで残り続けた「現行踏襲」
4脱システム監視。そしてビジネス監視へ
クラウド時代の監視・運用
5本日のまとめ
今後のAWSとローソン
Copyright (c) 2017 Lawson, Inc. All rights reserved. 3
1皆様に支えられています!
会社紹介
2日々これAWSなり!
AWSとローソンの歴史
3AWSの検討・利用が1段落してみて・・・
AWSで残り続けた「現行踏襲」
4脱システム監視。そしてビジネス監視へ
クラウド時代の監視・運用
5本日のまとめ
今後のAWSとローソン
Copyright (c) 2017 Lawson, Inc. All rights reserved. 4
1.会社紹介
▼1975年6月14日
約2兆円チェーン全店売上高
約22万人従業員 約13,000店店舗数
約1,000万人来店客数
(年間 約36億人)
成城石井
HMVユナイテッドシネマ
ローソンストア100ナチュラルローソン
ローソン1号店大阪 豊中にオープン
▼2017年5月31日42年
Copyright (c) 2017 Lawson, Inc. All rights reserved. 5
1.会社紹介
進藤広輔 「シンドウ コウスケ」
➢ 所属 業務システム統括本部システム基盤部
➢ 職位 マネジャー
➢ 専門 ネットワーク&セキュリティ(プリセールスとPM)
【担当業務】
➢ AWS関連プロジェクトの統括と推進
➢ AWS関連システムの運営とカイゼン
➢ 社内へのAWS関連の営業活動と18名からなるチーム運営
Copyright (c) 2017 Lawson, Inc. All rights reserved. 6
1.会社紹介
2015年ローソンがAWSを使うまでの軌跡
~打ち破れ現行踏襲~
2016年ローソンが考えるクラウド時代
に求められる新たなITパートナー像
2014年基調講演
AWS Summitとの歩み
Copyright (c) 2017 Lawson, Inc. All rights reserved. 7
1皆様に支えられています!
会社紹介
2日々これAWSなり!
AWSとローソンの歴史
3AWSの検討・利用が1段落してみて・・・
AWSで残り続けた「現行踏襲」
4脱システム監視。そしてビジネス監視へ
クラウド時代の監視・運用
5本日のまとめ
今後のAWSとローソン
Copyright (c) 2017 Lawson, Inc. All rights reserved. 8
2.ローソンとAWSの歴史
2.1 AWSとローソンの歩み
2013
2014
2015
2016
2017
2013AWS利用検討開始
2014店舗実験システムAWSガイドライン作成開始
2015発注セミオートシステムリリースAWSガイドライン0.5版
2016次世代店舗システム検討AWSガイドライン1.0版
2017次世代店舗システム構築開始
1
4
14
18
25
▲
▼
Copyright (c) 2017 Lawson, Inc. All rights reserved. 9
2.ローソンとAWSの歴史
2.2 AWSに対するアプローチの変化
「AWS」って何? どう使うの?
「AWS」に乗せよう! AWS最適化!
2013 2014
2015 2016
2014
2017
Copyright (c) 2017 Lawson, Inc. All rights reserved. 10
2.ローソンとAWSの歴史
2.3 なんでもAWSからの卒業
何でもAWS AWS or オンプレ 最適プラットフォーム
店舗システム
本部システム
EC
実証実験
新規
既存(マイグレ)
or
業務的SLA
性能諸元
処理特性
2013 2014 20172015 2016
Copyright (c) 2017 Lawson, Inc. All rights reserved. 11
2.ローソンとAWSの歴史
2.4 進化し続けるAWSへの対応
2014年 2016年
Copyright (c) 2017 Lawson, Inc. All rights reserved. 12
2.ローソンとAWSの歴史
2.5 役割(対応)の変化
~2016年 2017年~
オーダーメードによる『従来型SI』要件定義⇒設計⇒構築⇒テスト
メニュー形式の『サービス提供』ヒアリング⇒パッケージ選定
セキュア①セキュア②店舗①店舗②本部EC①EC②
Copyright (c) 2017 Lawson, Inc. All rights reserved. 13
1皆様に支えられています!
会社紹介
2日々これAWSなり!
AWSとローソンの歴史
3AWSの検討・利用が1段落してみて・・・
残り続けた「現行踏襲」
4脱システム監視。そしてビジネス監視へ
クラウド時代の監視・運用
5本日のまとめ
今後のAWSとローソン
Copyright (c) 2017 Lawson, Inc. All rights reserved. 14
3.残り続けた現行踏襲
3.1 従来の監視・保守・運用とは
ハードウェアレベルで起きたことに気付き
起きた後の対処をすることが基本
・ ・ ・ ・ ・
・ ・ ・ ・ ・
閾値超過インシデント発生
Copyright (c) 2017 Lawson, Inc. All rights reserved. 15
3.残り続けた現行踏襲
3.2 ローソンの監視・保守・運用の仕組み
LAWSONDC
監視中継サーバ
監視対象サーバ
監視Agent
監視対象AWSサービス
統合監視Monitor
統合監視サーバ
統合監視Manager
AWS共通基盤 業務システム
監視Aggregator
LAWSONAWS SQS
CloudWatch SNS
Redshift ELB Autoscaling
・・・
アプリ/インフラ保守担当者
ローソン維持管理チーム
Copyright (c) 2017 Lawson, Inc. All rights reserved. 16
3.残り続けた現行踏襲
3.3 ローソンの監視・保守・運用の課題
自分のサーバは正常に稼働しているんだけど・・・
ユーザの「遅い」「重い」「繋がらない」に気付けない
外部システムの正常・異常を能動的に把握出来ない
結局はユーザからの問合せがトリガーになる
Copyright (c) 2017 Lawson, Inc. All rights reserved. 17
3.残り続けた現行踏襲
3.4 従来の監視・保守・運用とAWSのギャップ
“従来” AWS
ハードウェアレベルのインフラ監視
従量課金
オートスケール
マネージドサービス
止まる・落ちる前提
起きたことへの対処
Copyright (c) 2017 Lawson, Inc. All rights reserved. 18
3.残り続けた現行踏襲
3.5 AWSの監視・保守・運用で感じていた違和感
EC2を10台で構成しているWebサーバの1台でリブート発生!
RDSでリスタート発生!原因はAWSのストレージ機構・・・
業務は何の問題もなく継続出来ている・・・
特に対処は出来ない・・・
Copyright (c) 2017 Lawson, Inc. All rights reserved. 19
3.6 ローソンの“チェンジ”と残り続けた現行踏襲
3.残り続けた現行踏襲
マインド
設計
関係性
• 作る⇒使う• 止まる前提• サイジングより起動
• AWS的“当たり前”
• 基盤と開発が合同• 情シスが主役
監視
保守
運用設計
運用
Copyright (c) 2017 Lawson, Inc. All rights reserved. 20
3.残り続けた現行踏襲
3.7 監視・保守・運用の“チェンジ”
・・・・・
自動で増えたり、減ったりするEC2
自動で切り替わるRDS
止まる・落ちる前提で設計するAWS
従来通りの監視・運用・保守
Copyright (c) 2017 Lawson, Inc. All rights reserved. 21
1皆様に支えられています!
会社紹介
2日々これAWSなり!
AWSとローソンの歴史
3AWSの検討・利用が1段落してみて・・・
AWSで残り続けた「現行踏襲」
4脱システム監視。そしてビジネス監視へ
クラウド時代の監視・運用
5本日のまとめ
今後のAWSとローソン
Copyright (c) 2017 Lawson, Inc. All rights reserved. 22
4.クラウド時代の監視・運用
4.1 ローソンの答え
“ビジネス”を監視し運用する
AWSの特性を理解し受け止める
単体ではなく“全体”を見る
サービスの“利用者の体感”を知る
自動復旧・マネージド
業務・サービス
レスポンス・重い・軽い
Copyright (c) 2017 Lawson, Inc. All rights reserved. 23
4.クラウド時代の監視・運用
4.2 ビジネス監視とは?
ビジネスに支障があるか・ないか
サービスの利用者の体感はどうか
③ユーザエクスペリエンスを視る
①システム全体・システム間の健全性を視る
ビジネスが何%以上正常に継続的に動いているか
② ビジネスの継続性・正常性を視る
Copyright (c) 2017 Lawson, Inc. All rights reserved. 24
4.3 ビジネス監視の対象と項目
4.クラウド時代の監視・運用
システム全体
論理サーバ
機能
画面
トランザクション
リクエスト数
エラー数
平均応答時間
最大応答時間
遅延応答時間
遅延リクエスト数
監視対象 監視項目
Copyright (c) 2017 Lawson, Inc. All rights reserved. 25
4.クラウド時代の監視・運用
4.3 ビジネス監視 システム構成図
Web/AP Batch R-Proxy
AppDynamics
Agent
Web/AP Batch
AppDynamics
Agent
コントローラサーバ
EUM
サーバ
業務システムA 業務システムB
AP共通基盤
店舗WAN
大崎本社 監視センター
ローソンDC
Copyright (c) 2017 Lawson, Inc. All rights reserved. 26
4.クラウド時代の監視・運用
4.4 ビジネス監視 アーキテクチャ
Web/AP Batch R-Proxy
AppDynamics
Agent
Web/AP Batch
AppDynamics
Agent
コントローラサーバ
EUM
サーバ
業務システムA 業務システムB
AP共通基盤
店舗WAN
大崎本社 監視センター
ローソンDC性能情報送信
性能情報送信
性能情報参照
ブラウザ性能情報参照
Copyright (c) 2017 Lawson, Inc. All rights reserved. 27
4.クラウド時代の監視・運用(参考)
①.システム全体の稼働状況確認
②.機能ごとの稼働状況確認
③.遅延が発生した状況を確認
④.処理のボトルネック解析
この画面ではシステムの構造と稼働状況(リクエスト数や性能値)が自動且つリアルタイムで可視化されている。この画面で稼働後の稼働状況チェックを行う
重大問題は赤でアラートされる
やや遅延は橙色でアラートされる
Copyright (c) 2017 Lawson, Inc. All rights reserved. 28
4.クラウド時代の監視・運用(参考)
この画面では画面/バッチごとの利用状況(実行数/平均処理時間)、指定ルールで自動判別された性能状況が表示される。この画面で性能問題調査を行う
①.システム全体の稼働状況確認
②.機能ごとの稼働状況確認
③.遅延が発生した状況を確認
④.処理のボトルネック解析
画面/バッチ名実行数
/平均処理時間エラー/性能状況
機能ごとの遅延状況がパーセンタイルで可視化される
Copyright (c) 2017 Lawson, Inc. All rights reserved. 29
4.クラウド時代の監視・運用(参考)
この画面では前画面で問題が発生している機能を特定し、どの実行に問題があったのかを識別する
①.システム全体の稼働状況確認
②.機能ごとの稼働状況確認
③.遅延が発生した状況を確認
④.処理のボトルネック解析
問題があると識別された箇所
Copyright (c) 2017 Lawson, Inc. All rights reserved. 30
4.クラウド時代の監視・運用(参考)
この画面では性能を満たせないトランザクションをクラス単位にブレークダウンし、遅延の原因を特定する
①.システム全体の稼働状況確認
②.機能ごとの稼働状況確認
③.遅延が発生した状況を確認
④.処理のボトルネック解析
アプリケーションの処理を解析しJavaのクラス毎に処理時間を表示
発行SQLを特定して表示
Copyright (c) 2017 Lawson, Inc. All rights reserved. 31
4.クラウド時代の監視・運用
4.5 ビジネス監視は何をもたらすのか?
設計~運用までをシステム部主導で推進出来る
システム部が直接ユーザの声を知ることが出来る
考え・取り組みがクラウドネイティブ
となる
リーダシップ ユーザ起点 クラウド深化
Copyright (c) 2017 Lawson, Inc. All rights reserved. 32
1皆様に支えられています!
会社紹介
2日々これAWSなり!
AWSとローソンの歴史
3AWSの検討・利用が1段落してみて・・・
AWSで残り続けた「現行踏襲」
4脱システム監視。そしてビジネス監視へ
クラウド時代の監視・運用
5本日のまとめ
今後のAWSとローソン
Copyright (c) 2017 Lawson, Inc. All rights reserved. 33
5.1 真のクラウドファーストへ向けて
AWS次第?
監視・保守・運用をAWSに最適化する
設計をAWSに最適化する
マインドをチェンジする
AWSを理解する
5.今後のAWSとローソン
AWSに出会う2013
2014
2015
2016
2017
2018
監視・保守・運用をAWSに最適化する
Copyright (c) 2017 Lawson, Inc. All rights reserved. 34
5.今後のAWSとローソン
5.2 AWSへの期待とローソンの今後
Cloud で次世代システムを推進
インフラを抽象化し
ビジネスと業務の本質に注力
Copyright (c) 2017 Lawson, Inc. All rights reserved. 35
ご清聴ありがとうございました。