Умник
DESCRIPTION
TRANSCRIPT
Облачный сервис интеллектуального анализа данных
Алтайский Государственный Университет
Нуждин Павел Вячеславович, аспирант
Команда
2
● Мусиенко Н., бакалавр прикладной математики и информатики, магистрант МФ АлтГУ.
● Вязьмина А., бакалавр прикладной математики и информатики, магистрант МФ АлтГУ.
● Жилин С., к.ф.-м.н, зав. кафедры информатики МФ АлтГУ.
● Пятков В., магистр прикладной математики и информатики, аспирант МФ АлтГУ.
● Ледомский П., бакалавриат МФ АлтГУ.
● Киргизов С., магистр прикладной математики и информатики, аспирант LIP6 Université Pierre & Marie Curie.
● Нуждин П., магистр прикладной математики и информатики, аспирант МФ АлтГУ.
Актуальность идеи
● Необходимо решать как малые так и большие задачи (BigData).
● Необходимо поддерживать собственное аппаратное обеспечение.
● Необходима мобильность аналитиков.
● Возможность коллективной работы. 3
Кластеризация Регрессия Классификация
Предлагаемое решение
4
HTTP
КлиентВеб-браузер
Облачный сервис интеллектуального анализа
данных
Обоснование научной новизны проекта
● Суть проекта в объединении ранее известных технологий:
● Машинное обучение & Интеллектуальный анализ данных.
● Облачные вычисления.
● Распределенные вычисления.
● Ссылки:
● Киргизов, С. С. Интернет-сервис интеллектуального анализа данных. Модель потоковых сценариев. Магистерская диссертация / С. С. Киргизов // АлтГУ — Барнаул. — 2011.
● Вязьмина, А. Н. «Облачный» сервис интеллектуального анализа данных. Графический интерфейс построения сценариев анализа. Выпускная квалификационная работа / А. Н. Вязьмина // АлтГУ — Барнаул. — 2012.
● Мусиенко, Н. П. Интерфейс облачной системы интеллектуального анализа данных. Выпускная квалификационная работа / Н. П. Мусиенко // АлтГУ — Барнаул. — 2012.
● Нуждин, П. В. Облачный сервис интеллектуального анализа данных. Магистерская диссертация / П. В. Нуждин // АлтГУ — Барнаул. — 2012.
21
Техническая значимость
22
Название Интерфейс Возможность решать большие задачи
Групповая работа
Модульность
KNIME Да (KNIME сервер)
Да (KNIME сервер)
Да
RapidMiner Да Нет Да
Taverna Да Нет Да
Orange Да (Orange4WS) Нет Да
DMSaaS Web (PC, iPad, Android)
Да (Apache Hadoop, ...)
Да Да (Java, Python, R, Weka, Mahout)
● REST API с возможностью интегрирования в различные приложения.
● Решение задач анализа данных в виде потоковых сценариев аналогично популярным аналитическим инструментам.
● Справочные материалы и помощники для обучения анализу данных.
Перспектива коммерциализации
● Пользователи потребляют дисковое пространство для хранения данных & результатов и тратят время для решения задач.
● У каждого пользователя каждый месяц есть бесплатно предостляемый неаккумулируемый объем дискового пространства.
● Пользователи покупают дополнительное дисковое пространство и время для решения задач. 23
Бизнес:управление
производственнымипроцессами,управлениефинансами,маркетинг,
веб-аналитика
Наука:геномика,
протеомика,метаболомика,спектроскопия,дистанционноезондирование
Образование:курсы
ML & Data Mining
План реализации
● начало 2013 г. – доработка и отладка прототипа, подготовка к высоким нагрузкам.
● 2013-2014 г. – опытная эксплуатация, открытие для мирового использования через Интернет.
● 2015 г. – оказание дополнительных услуг связанных с анализом данных (обучение, аналитика).
24