jak wyglada monitoring w plix
TRANSCRIPT
Jak wygląda monitoring sieci
w PLIX?
Kamil Grabowski, Paweł Nastachowski
PLIX
Co monitorujemy?
• Stany sesji BGP • Wielkość ruchu IP • Dostępność BGP neighbors • Stan portów na switchach (up/down)
Popularne narzędzia do monitoringu sieci
Narzędzie Wady
Nagios - monitorowanie poprzez odpytywanie, - brak możliwości grupowania zdarzeń
Cacti - problemy podczas przepinania klientów, - brak integracji z CRM, - brak sumowania ruchu z wybranych portów, - niewygodne zarządzanie, - brak redundancji i odporności na awarie
Smokeping - słaba notyfikacja, dużo maili
Trap browser - ogromna ilość zdarzeń do przejrzenia, - brak możliwości grupowania zdarzeń - brak możliwości filtrowania/wyszukiwania
Typowe problemy systemów monitoringu sieci
• Wiele narzędzi to: • wiele różnych API, • wiele różnych interfejsów użytkownika, • wiele różnych plików konfiguracyjnych, • wiele różnych typów notyfikacji (maile, www, sms), • ... oraz brak możliwości personalizacji (np. przypisanie klienta do portu), liczenie SLA (umowa z klientem), precyzyjne definiowanie czasu awarii
• To wszystko powoduje, że mamy dobry monitoring, ale bardzo nieczytelny.
Typowe problemy systemów monitoringu sieci
• Brak redundancji • Podatność na awarie • Trudność w utrzymaniu i aktualizacji • Skomplikowane zależności pomiędzy elementami systemu • Długi czas „disaster recovery”, • Niska wydajność, duplikowanie procesów
PLIX LAB -‐ cel • Stworzenie wydajnej i redundantnej infrastruktury NOC, • Stworzenie jednolitego systemu alertowania anomalii występujących w sieciach plix,
• Inteligentny monitoring – diagnozowanie, grupowanie oraz filtrowanie zdarzeń,
• Centralizacja (webservice) – jednolite API dla wszystkich narzędzi,
• Personalizacja systemów w kierunku SLA i warunków umowy z klientem,
• Szybsze informowanie klientów o anomaliach pojawiających się w ich sieciach,
PLIX LAB -‐ realizacja
• Nowa infrastrukutra • My.plix • Admin.plix • Webservice -‐ API • Trap Monitor • Live Network Map • Live Network Traffic Graph
Realizacja -‐ infrastruktura
• Redundancja usług, • Wirtualizacja maszyn, • Uproszczenie procesu deployowania i utrzymania, • Optymalizacja procesów (brak duplikacji zadań)
Realizacja – infrastruktura
Realizacja -‐ my.plix
Realizacja – admin.plix
• Pełne informacje o kliencie (porty, sesje, statystyki) • Zarządzanie infrastrukturą • Konfiguracja narzędzi, z których jeszcze korzystamy (np. nagios, smokeping),
• System bcketowy –
Realizacja – narzędzia Trap Monitor
• Wizualizacja zdarzeń (na żywo), • Centralizacja, • Grupowanie zdarzeń na podstawie posiadanych w systemie informacji o kliencie (sesja, port, ip),
• Jednolita notyfikacja i ackowanie, • Trap browser, • Precyzyjne liczenie czasu awarii
Realizacja – narzędzia Trap Monitor
Realizacja – narzędzia Live Network Map
• Wizualizacja infrastruktury sieciowej, • Stan infrastruktury sieciowej, • Wysycenia uplinków pomiędzy switchami, • Wizualizacja zdarzeń na urządzeniach.
Realizacja – narzędzia Live Network Map
Realizacja – narzędzia Live Network Traffic Graph
• Rysowanie wykresów z ruchu na wybranych portach, (np. uplinki) w czasie rzeczywistym,
• Próbkowanie co 30-‐60 sekund (do wyboru)
PLIX LAB – bieżące projekty Trap Monitor
• Tworzenie bcketów na podstawie zgrupowanych zdarzeń,
• Grupowanie i filtrowanie zdarzeń po zadanych wartościach np. oprogramowanie BGP, dostawca transmisji, lokalizacja,
• Inteligentne diagnozowanie – umiejętność wykrycia braku zasilania na LIM, awarii u dostawcy transmisji, błędy w oprogramowaniu.
PLIX LAB – bieżące projekty Live Network Traffic Graph
• analiza ruchu (ruch mulbcastowy, broadcastowy), • anomalie (spadki oraz piki)
Dziękujemy za uwagę J