Нейронные сети на страже индустриальной...

Нейронные сети на страже индустриальной кибербезопасностиПавел Филонов

… EVERYTHING ISBETTER WITH …

NEURAL NETWORKS!

digitalsubstation.ru

http://taneco.tatneft.ru/

Физика ПЛК Полнота Данные

Реальный объект

Реальная Реальные Только «хорошие» примеры

Трудно добывать данные





Натурная модель

Упрощенная Реальные Мало «плохих» примеров

Долго добывать данные





Натурная модель

Упрощенная Реальные Мало «плохих» примеров

Долго добывать данные

Компьютерная модель

Модельная Модельные Много различных примеров

Легко добывать данные

Многомерный временной ряд

Подходы к снаряду

Rules Based Systems• Прозрачные• Нужен эксперт• Ловят только то, что знают• Сложны в реализации• Долгое внедрение• Ложные срабатывания

Machine Learning• Непрозрачные• Нужны данные• Могут поймать новые атаки• Просты в реализации• Быстрое внедрение*• Ложные срабатывания*

Machine learning за 5 минут

Start

Segmentation PCA

Feed forward

networksLSTM

Finish

Сигнал

ССегментация

Извлечение признаков(𝑥11 ⋯ 𝑥1𝑚

⋮ ⋱ ⋮𝑥𝑛1 ⋯ 𝑥𝑛𝑚

)

Сегменты

Матрица признаков

Кластеризация

Кластеры

Кодирование цепочек

Последовательностиметок

Сегментация• Достоинства• Удобно визуализировать• Можно легко трактовать• Можно применять символьные методы

• Недостаки• Трудоемкие онлайн-алгоритмы• Сложно обобщить на многомерный случай• Необходимо подбирать много параметров• Неизвестное заранее число кластеров

Start

Segmentation PCA

Feed forward

networksLSTM

Finish

Метод главных компонент (PCA)

Метод главных компонент• Достоинства• Быстрые алгоритмы обучения• Эффективные онлайн-алгоритмы• Хорошо укладывается в многомерный случай

• Недостатки• Плохо подходит для случая нелинейных зависимостей• Работает без памяти• Непрозрачный

Start

Segmentation PCA

Feed forward

networksLSTM

Finish

Заглянем в будущее

Заглянем в будущееInput

Hidden

Output

Сети прямого распространения• Достоинства• Быстрые онлайн-алгоритмы вывода• Хорошо справляются с многомерными данными• Хорошо описывают нелинейные зависимости

• Недостатки• Долгое время обучения• Непрозрачность• Необходимо подбирать размеры временного окна

Start

Segmentation PCA

Feed forward

networksLSTM

Finish

Рекуррентные нейронные сети

Изображение: colah.github.io

Рекуррентные нейронные сети

Изображение : colah.github.io

Stacked LSTM

Реккурентные сети• Достоинства• «Бесконечная» память• Эффективные онлайн-алгоритмы вывода

• Недостатки• «Холодный» старт• Очень доглое время обучения• Непрозрачность

Die Hard Xчерновик сценария

Заводик работает в штатном режиме

В системе завелся зловред

Что-то пошло не так!

Есть сигнал!

Оценка качестваШеф, у нас проблемы В городе все спокойно

Осуществляется атака True Positive (TP) False Negative (FN)

Штатный режим False Positive (FP) True Negative (TN)

Точность (precision)

Полнота (recall)

Кручу-верчу

𝐹=2 𝑃 ∙𝑅𝑃+𝑅

-мера:

Источники1. Stuxnet: первые жертвы – blogpost2. Будни немецких сталеваров – blogpost3. E. Keogh, S. Chu, D. Hart, and M. Pazzani. Segmenting Time Series: A

Survey and Novel Approach – paper4. L.H. Chiang, E.L. Russel, and R.D. Bratz. Fault Detection and

Diagnosis in Industrial Systems – eBook5. E. Keogh, J. Lin, and A. Fu. HOT SAX: Finding the Most Unusual Time

Series Subsequence: Algorithms and Applications – paper6. K. Koutroumbas, S. Theodoridis. Pattern Recognition - eBook

https://securelist.ru/analysis/obzor/24277/stuxnet-pervye-zhertvy/

https://eugene.kaspersky.ru/2015/04/13/budni-nemeckix-stalevarov/

https://www.cs.rutgers.edu/~pazzani/Publications/survey.pdf

http://www.springer.com/in/book/9781852333270

http://www.cs.ucr.edu/~eamonn/discords/HOT%20SAX%20%20long-ver.pdf

https://www.amazon.com/Pattern-Recognition-Fourth-Sergios-Theodoridis/dp/1597492728

Источники7. L. Huang, X. Ngueyn, M. Garofalakis, M. Jordan, A. Joseph, and N. Taft.

In-Network PCA and Anomaly Detection – paper8. A. Lebedevich. Statistics for Monitoring: Anomaly Detection – blogpost9. К. В. Воронцов. Прогнозироваие временных рядов – slides, video10. Neural Networks for Time Series Prediction – slides11. P. Malhotra, A. Ramakrishnan, G. Anand, and L. Vig. LSTM-based

Encoder-Decoder for Multi-sensor Anomaly Detection – paper12. P. Malhotra, L. Vig, G. Shroff, P. Agarwal. Long Short Term Memory

Networks for Anomaly Detection in Time Series - paper

https://papers.nips.cc/paper/3156-in-network-pca-and-anomaly-detection.pdf

http://mabrek.github.io/blog/statistics-for-monitoring-anomaly-p1/

http://www.machinelearning.ru/wiki/images/c/cb/Voron-ML-forecasting-slides.pdf

https://yandexdataschool.ru/edu-process/courses/machine-learning#item-8

https://www.cs.cmu.edu/afs/cs/academic/class/15782-f06/slides/timeseries.pdf

https://drive.google.com/file/d/0B8Dg3PBX90KNQWRwMElkVkQ0aFgzZGpzOGQtUU5DeWZYUlVV/view

https://www.elen.ucl.ac.be/Proceedings/esann/esannpdf/es2015-56.pdf

Источники13. A. Nanduri, L. Sherry. Anomaly detection in aircraft data using recurrent

neural networks (RNN) – paper14. A. Karpathy. The unreasonable effectiveness of rcurrent neural

networks – blogpost15. C. Olah. Understanding LSTM Networks – blogpost16. J. Brownlee. Time Series Prediction with LSTM Recurrent Neural

Networks in Python with Keras – blogpost17. S. Hochreiter, J. Schmidhuber. Long Short-Term Memory - paper18. Y. Bengio, P. Simard, and P. Frasconi. Learning Long-Term Dependencies

with Gradient Descent is Difficult - paper

http://catsr.ite.gmu.edu/pubs/ICNS_2016_AnomalyDetectionRNN_01042015.pdf

http://karpathy.github.io/2015/05/21/rnn-effectiveness/

http://colah.github.io/posts/2015-08-Understanding-LSTMs/

http://machinelearningmastery.com/time-series-prediction-lstm-recurrent-neural-networks-python-keras/

http://deeplearning.cs.cmu.edu/pdfs/Hochreiter97_lstm.pdf

http://www-dsi.ing.unifi.it/~paolo/ps/tnn-94-gradient.pdf

Спасибо за внимание!

email: [email protected]: github.com/sdukshistwitter: @filonovpv

mailto:[email protected]

А нам нужно GPU?• Горизонт прогноза – 5 минут• Количество каналов ~ 600• Keras 1.1.0• Theano 0.8.2• CUDA 8RC

Спасибо команде Nvidia!

Нейронные сети на страже индустриальной...

Engineering