От количества к качеству аналитика данных и повышение...
Post on 07-Aug-2015
25 views
TRANSCRIPT
ОТ КОЛИЧЕСТВА К КАЧЕСТВУ : Аналитика данных и повышение эффективности
пассажирских перевозок
Чеботарев Роман Архитектор аналитических решений
КРОК
Гараничев Андрей Руководитель проектов
ЦППК
2
СОДЕРЖАНИЕ
1. Место BigData в пассажирских перевозках 2. Моделирование и прогнозирование пассажиропотока 3. Контроль за безбилетными пассажирами 4. Оптимизация работы кассовых узлов
3
BIGDATA И ПАССАЖИРСКИЕ ПЕРЕВОЗКИ
4
ОАО «ЦЕНТРАЛЬНАЯ ППК» В ЦИФРАХ
> 1,6 млн пассажиров
> 1300 ниток расписания
ЦППК – это:
• 60% пригородных перевозок РФ
• Более 1500 остановочных пунктов
• 617 млн вагоно-километров
• 583 млн пассажиров в год
1 день ЦППК
5
СИТУАЦИОННО-АНАЛИТИЧЕСКИЙ ЦЕНТР ЦППК
• Мониторинг показателей текущей деятельности ЦППК • Оперативная работа (подсистема работы с инцидентами) • Сводки и отчеты • Прогнозы ключевых показателей деятельности
6
МОДЕЛИРОВАНИЕ ПАССАЖИРОПОТОКА
7
ЧТО ТАКОЕ «ПАССАЖИРОПОТОК»
С точки зрения аналитики пассажиропоток – это ситуация на пригородных электричках в любой момент времени:
• Сколько людей едет в каждой электричке? • Откуда и куда они едут? • Сколько людей ждут на остановочном пункте? • Куда они хотят поехать?
8
МОДЕЛЬ ПАССАЖИРОПОТОКА
Входящий поток
Выходящий поток
Центр Область
Остановочный пункт
Модель пассажиропотока = эти 4 показателя с дискретностью в 1 минуту по всем остановочным пунктам ЦППК + помним «путь» каждого пассажира
9
КАК СЧИТАТЬ ПАССАЖИРОПОТОК
- По данным турникетов? - Нет! Турникеты охватывают далеко не все остановочные пункты, т.е. позволяют оценить только часть пассажиропотока
- А как тогда составить модель? - По данным билетов, расписанию движения поездов, проверяя модель данными турникетов там, где это возможно. - Использовать существующие объемы данных для уточнения и повышения точности модели.
10
МОДЕЛИРУЕМ ПАССАЖИРОПОТОК #1
Используем разовые билеты для восстановления профиля движения пассажиров:
• Достаточно точно известно время отправления • Почти 40% пассажиропотока
По данным о ближайшем поезде, соответствующем билету, определяем время прибытия
11
МОДЕЛИРУЕМ ПАССАЖИРОПОТОК #2
Определяем время обратной поездки для билетов «туда-обратно» и абонементов:
• Время покупки • Восстановленные профили станций • Некоторые «демографические» данные и заключения
Аналогичным способом определяем время поездок в другие дни.
12
МОДЕЛИРУЕМ ПАССАЖИРОПОТОК #3
Корректировка с учетом турникетных данных: • В среднем менее 6%, пиковая зафиксированная разница – 14,2% • Выполняется опционально, т.к. есть «зайцы»
«Рассадка» пассажиров по поездам в соответствии с билетами:
• Определение пассажиропотока в разрезе поездов • Корректировка при дисбалансе вход/выход
‒ Корректировка не требуется для 19% поездов ‒ Только на 3,5% поездов дисбаланс составляет более 15 человек
13
ПИЛОТНАЯ ЗОНА – КИЕВСКОЕ НАПРАВЛЕНИЕ
54 остановочных пункта
~ 66,5 тыс. проданных билетов
~ 12 тыс. проходов через турникеты
~ 420 ниток расписания
ЕЖЕДНЕВНО
Москва
Калуга
Наро-Фоминск
Апрелевка
Малоярославец
14
ТЕХНОЛОГИЧЕСКИЙ СТЕК
Хранилища данных
Data Mining (анализ, моделирование и прогнозирование)
15
ПОЧЕМУ BIGDATA (MPP-СУБД) ?
Не устраивала производительность существующих СУБД и средств аналитики – низкая скорость проведения сложных статистических расчетов Обновление модели пассажиропотока: • Классические СУБД – более 9 часов • BigData-подход – около 2 часов, хорошая масштабируемость • И это без оптимизаций и «тюнинга» планировщиков!
Можем быстро обновлять модель – учесть прошедший день за ночь!
16
РЕЗУЛЬТАТЫ #1
Населенность: • любого поезда • любой станции • в любой момент времени
17
РЕЗУЛЬТАТЫ #2
Сколько пассажиров необходимо вывезти альтернативными видами транспорта при блокировке движения электропоездов?
18
РЕЗУЛЬТАТЫ #3
19
РЕЗУЛЬТАТЫ #4
Пиковая населенность поездов, 2 декабря 2014
20
РЕЗУЛЬТАТЫ #5
21
ПОДСЧЕТ БЕЗБИЛЕТНИКОВ
22
ПОДСЧЕТ БЕЗБИЛЕТНИКОВ
Организуются меры по пресечению безбилетного проезда (наряды полиции, ЧОП и т.п.), контролируется эффективность этих мер
При помощи установленных камер и видеоаналитики фиксируются факты «нештатного» проникновения или покидания платформы. В соответствии с ближайшим поездом рассчитывается средняя «стоимость» безбилетного пассажира.
23
ОПТИМИЗАЦИЯ РАБОТЫ КАСС
24
ПОДСЧЕТ КОЛИЧЕСТВА ЛЮДЕЙ НА КАССАХ
Подсистема используется для: • Оперативного управления кассовыми узлами • Анализа и контроля качества обслуживания
При помощи видеоаналитики в автоматическом режиме осуществляется подсчет количества людей в очередях При наличии очереди в течении 10 минут формируется т.н. инцидент
25 111033, Москва, ул. Волочаевская, д.5, корп.1
www.croc.ru
• По данным отчетов IDC, КРОК — лидер по услугам системной интеграции (2002-2014)
• В десятке крупнейших ИТ-компаний России (РИА Рейтинг, «Коммерсантъ – Деньги», Cnews, 2014) в пятерке крупнейших консалтинговых компаний (РА Эксперт, 2014)
• Реализует несколько тысяч проектов в год
• Сертификат качества Р ИСО 9001-2008
• КРОК — крупнейший российский партнер HP, Fujitsu, EMC, Cisco Systems, Avaya, Microsoft, Oracle
СПАСИБО ЗА ВНИМАНИЕ!
Гараничев Андрей Руководитель проектов ЦППК
[email protected] +7 499 266-02-65 # 7414
Чеботарев Роман Архитектор аналитических решений
[email protected] +7 495 974-22-74 # 7044