predizione di malfunzionamenti in reti di telecomunicazioni con tecniche di machine learning

PREDIZIONE DI MALFUNZIONAMENTI IN RETI DI TELECOMUNICAZIONI CON TECNICHE DI MACHINE LEARNING

Relatore: prof. Alberto Bartoli Correlatore: prof. Eric Medvet Laureando: Francesco Occhioni

Anno accademico: 2015-2016

Tesi di Laurea Magistrale in Ing. Informatica

Introduzione

Collaborazione con:

● Emaze S.p.A

● Operatore Telefonico Nazionale

Obbiettivi

Migliorare:

● Il servizio del CRM● La soddisfazione del cliente

Sviluppo e realizzazione di un Proof of Concept per:

● Strumento di supporto alla proactive assurance● Valutare applicazione di tecniche di Machine Learning

Obbiettivi

Cosa effettivamente “prevedere?”

Come poter definire un guasto?

Necessario uno studio e un reverse engineeringdei sistemi informativi preesistenti

Stato attuale - CPE

Customer Premise Equipment

● Dispositivo assegnato all’utente● Connessione alla WAN

Identificabile da Link Reference

Differenziati per tipo di linea e tipo di servizi offerti

Link Reference

Stato attuale - Monitoring

3 Sistemi per il monitoraggio dei CPE in tempo reale:

● SeQuMo● CDSeQuMo● HaWMo

Coprono il 95% della customer base

Rilevazione dei Key Performance Indicator (KPI) da ogni CPE

#SeQuMo = 65% sul totale#CDSeQuMo = 30% sul totale#HaWMo = 15% sul totale

Stato attuale - SeQuMo

Rilevazione dei KPI ogni 15 minuti

● Mos - Mean Opinion Score● Latenza HTTP● Latenza DNS● Reboot● Stato Linea Primaria

Stato attuale - CDSeQuMo

Rilevazione dei KPI ogni 15 minuti

● Packet Loss ● Download Rate● Upload Rate● Mos● Latenza HTTP● Latenza DNS● Reboot● Stato linea Primaria

Stato Attuale - Ticketing

Ticket: lamentela o un reclamo da parte della clientela in relazione ad un disservizio sull’infrastruttura di rete

Data di Apertura - Data di Chiusura - Close Code

Previsione Ticket ≈ Previsione Guasti

Classificatore - Costruzione DataSet

Riferimenti temporali:

Istanza Positiva:

● “Tra t+G e t+G+H si aprirà un Ticket su questo CPE”

Istanza Negativa:

● “Tra t+G e t+G+H non si aprirà un Ticket su questo CPE”

Classificatore - N/A e Sbilanciamento

Approcci comuni in letteratura:

Trattamento dei Missing Values ( N/A ):

● Sostituiamo ogni N/A con il valore medio della feature● “Non c’è” ≣ “C’è ed ha il valore medio”

Trattamento dei dati sbilanciati:

● #istanze negative ≅ 1000 #istanze positive● Training Cost Sensitive

Classificatore - Valutazione Prestazioni

Confusion Matrix:

True Positive Rate:

● % Ticket predetti che si sono verificati

False Positive Rate:

● % Ticket predetti che non si sono verificati

Classificatore - Valutazione Prestazioni

Reciever Operating Characteristics:

Valuto TPR per FPR=0.25

Quanti ticket riesco a prevederecon un 25% di falsi allarmi ?

Classificatore

Random Forest

● Basato su alberi decisionali● Molto efficiente● Resistente all’overfitting

Alberi Decisionali

● Facilità di interpretazione● Buona accuratezza generale● Robustezza al rumore

Risultati

Per ogni sistema di monitoraggio:

● TPR

● FPR

● TPR con FPR = 0,15%

Risultati - CDSeQuMo (TPR)

Con granularità di 15 minuti prevedo il 65% dei Ticket

Con granularità di un’ora prevedo il 90% dei ticket

Con granularità H>1h prevedo il 95% dei ticket

Risultati - CDSeQuMo (FPR)

All’aumentare della granularità H aumentano i falsi allarmi

Worst Case:

● Falsi Allarmi ≅ 3%

Risultati - CDSeQuMo (TPR@0,15%)

Con granularità di 15 minuti prevedo solo il 25% dei Ticket

Risultati - SeQuMo (TPR)

Con granularità di 15 minuti prevedo il 65% dei Ticket

Con granularità di un’ora prevedo il 85% dei ticket

Risultati - SeQuMo (FPR)

All’aumentare della granularità H aumentano i falsi allarmi

Worst Case:

● Falsi Allarmi ≅ 15%

Risultati - SeQuMo (TPR@0,15%)

Previsione dei ticket del 60%

Con G > 5h le prestazioni peggiorano sensibilmente

Conclusione

I classificatori funzionano:

● Previsione dei Ticket in percentuale alta● Bassa percentuale di falsi allarmi● Buone le previsioni con falsi allarmi dello 0,15%

Prestazioni migliori su CDSeQuMo rispetto a SeQuMo

● KPI di raggiungibilità e Upload/Download rate migliorano il classificatore

Sviluppi Futuri

● Presentazione delle prestazioni al committente

● Rilascio in produzione

● Valutazione in ambiente reale e taratura del classificatore

● Valutare le prestazioni in base a diverse tipologie linea

● Predizione di guasti

Grazie per l’attenzione!

predizione di malfunzionamenti in reti di telecomunicazioni con tecniche di machine learning

Engineering

università politecnica delle marche istituto di biologia e...

lezione12 - homology...

modelli per la predizione della crescita di microrganismi...

climatizzatori d’aria - tettamanti · pdf...

predizione del titolo virale in un processo industriale...

ne arel srl non sarà responsabile per eventuali ......ne...

processi e privacy indirizzi di riferimento: processi e...

universita degli studi di padova` facolta di...

e-learning supporto ai corsi di studio - sistemi di...

eurovocs suite manuale utente - standaard hosting pagina ·...

lo splicing dell’rna definizione importanza predizione

struttura e funzione di biomolecole - siti personali...

modellamento qsar e predizione della tossicita di fenoli...

“tecniche di classificazione e predizione...

il consecutivo come norma o come predizione dell ... · il...

algoritmi farmacogenetici per la predizione della … ·...

università degli studi di...

11° recall,malfunzionamenti e sepsi

la valorizzazione agronomica dei reflui “strategie e...

modelli trasandati perchÉ in scienza, oltre un …numero di...