zabbix v2

7
Внедрение системы мониторинга «ZABBIX» для платформы «SDP»

Upload: alex-nikitin

Post on 16-Jul-2015

1.448 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Zabbix v2

Внедрение системы мониторинга

«ZABBIX»

для платформы

«SDP»

Page 2: Zabbix v2

2

ПреимуществаТекущая система мониторинга (недостатки) Будущая система мониторинга ZABBIX (преимущества)

• Данные обновляются раз в семь минут. Нет возможности обновлять метрики с разными интервалами времени

• Нет возможности горизонтального масштабирования

• Пороги оповещения срабатывают по примитивному алгоритму. Высок процент ложного срабатывания оповещения. Пороговые значения множества данных отслеживается только в ручном режиме.

• Нет возможности детально проанализировать метрику. Нет масштабирования данных по произвольному интервалу времени.

• Новые метрики заводятся по запросу в компанию Teligent, крайне не оперативно.

• Набор отображаемых данных недостаточен.

• Мониторинг находится на обслуживании компании Teligent. Не требуются ресурсы для его поддержания и развития

• Для мониторинга нового функционала достаточно завести задачу в Teligent

• Обновление от 10 секунд на метрику. Метрики могут обновляться с разными интервалами, за счет чего оптимизируется нагрузка и повышается информативность.

• Есть возможность создать кластер, если нагрузка на хост мониторинга будет чрезмерной.

• Есть возможность настроить сложные триггеры, формировать комплексные метрики, строить зависимости в оповещениях проблем. Низкий процент ложного срабатывания оповещения. Следствие – можно предупреждать аварии, а не оповещать о факте их обнаружения.

• Просмотр отдельной метрики и масштабирование до необходимого уровня за весь период сбора и хранения метрики (6-12 месяцев).

• Новые метрики заводятся быстро, по факту появления необходимости.

• Возможность видеть новые полезные метрики.

• Для поддержания и развития мониторинга требуется специалист внутри компании МТС.

• Для мониторинга нового функционала платформы требуется согласовать с разработчиками механизм мониторинга

Текущая система мониторинга (преимущества) Будущая система мониторинга ZABBIX (недостатки)

Page 3: Zabbix v2

3

Цель по мониторингу

• Иметь актуальную информацию о состоянии платформы

• Предупреждать об аварии до ее появления

• Хранить необходимую статистику для анализа аварийных ситуаций

• Сократить время выявления проблемной зоны в аварийной ситуации

• Сократить время реагирования администратора в аварийнойситуации

• , , Хранить статистические данные о тарификации трафике обработке промежуточных CDR . .файлов и т д

Page 4: Zabbix v2

4

Техническое решение

Мониторингтранзакций

основных элементовплатформы

Мониторингтранзакций

основных элементовплатформы

Доступность хостов по сети Доступность хостов по сети

Мониторинг интерфейсов сопряжения с соседними

платформами

Мониторинг интерфейсов сопряжения с соседними

платформами

Мониторинг баз данных

по основнымпараметрам

Мониторинг баз данных

по основнымпараметрам

Парсинг CDR, EDR файлов для мониторинга

статистической информации

Парсинг CDR, EDR файлов для мониторинга

статистической информации

ЗагрузкаCPU, memory,

file system,

interfaces

ЗагрузкаCPU, memory,

file system,

interfaces

Мониторинг загрузки основных элементов

платформы

Мониторинг загрузки основных элементов

платформы

:Мониторинг – – Запрос обработка – анализ оповещение

:Мониторинг – – Запрос обработка – анализ оповещение

Page 5: Zabbix v2

5

Техническое решение

SMP RTC LBAS SPDSAS SDF PDBLDB

PROV

PROVDB

SURV

ZABBIX STAT

DB

ZABBIX DBZABBIX

ZABBIX

PROXY

,

,

,

,

МР

Мос

ква

МР

СЗ

МР

ПЮ

ВМР

ПСЗ

, ,

,МР

Юг

МРСиб

ирьМРУра

лМРДВ

МР

Мос

ква Хранение данных

статистики

Хранение

временных данных

Для статистики CDR/EDR

Парсинг EDR

Парсинг CDR

Опрос

ZABBIX PROXY

по регионам

Опрос

Хостов в МР

для снятия метрик

Хосты хранения

CDR/EDR

файлов

Page 6: Zabbix v2

6

Результаты сегодня

• 377 Установлено хостов на мониторинг /

8895 снимается метрик с платформы /

3136 настроено различных оповещений с

различными приоритетами

• Настроено отображение аварийных зон на

. географической карте Подсвечивание группы

.хостов в соответствии с приоритетом аварии

• Настроены отображения классических и

комплексных графиков по хостам или группам

.хостов

• -Обеспечена возможность видеть последние лог

, файлы запущенные процессы или доступность

хоста с помощью интерфейса мониторинга

Page 7: Zabbix v2

7

Развитие

• Обеспечить отказоустойчивость системы мониторинга и базы данныхмониторинга (IVQ2012)

• Добавить загрузку/ работоспособность компонент платформы p90e (SDP) на хостах всех МР и настроить соответствующие оповещения(IVQ2012)

• Добавить на мониторинг доступность/ загруженность интерфейсов между группами хостов платформы по всем МР и настроить

(соответствующие оповещения IVQ2012)

• Настроить сбор метрик в разрезе планирования capacity (IQ2013)

• Установить zabbix-proxy в каждом МР для снятия нагрузки с центрального хоста zabbix (IVQ2012)

Планы развития мониторинга Zabbix: