Аналитика в общественной деятельности
TRANSCRIPT
АНАЛИТИКА ВОБЩЕСТВЕННОЙДЕЯТЕЛЬНОСТИ
(на примере избирательных кампаний)
Василенко Евгений[email protected]
Проблема «неиспользования данных»
отсутствиеколичественныхкритериев дляклассификации
событий и явлений
неполное доведениерезультатов работы
до конечного потребителя,низкая степень восприятия
представленнойинформации
отстутствие единогомассива данных непозволяет повторно
повторно использоватьинформацию;
отсутствие аналитики,как таковой - «рваный»
ритм в обработке данных
низкая репрезентативностьполученных выводов,
отсутствие информациио погрешностях
и доверительныхинтервалах
пропуск знаний и опытав результате неполнойпроработки имеющихся
массивов данных
невозможностьпривлечения знаний
из смежных областейисследований,невозможность
передачи знаний иопыта!
2
! Записывайте номер страницы, если возник вопрос
Возможности и решения
●анализ данных на больших массивах можно проводить «до бесконечности»
●объединение данных из разных источников даёт синергетический эффект
●инструменты анализа открыты и доступны: программное обеспечение с открытым исходным кодом
●визуализация обязательна!
●многие отрасли используют схожие методики: маркетинговые исследования, социологические исследования, экологический мониторинг, электоральные исследования
3
Инструменты анализа данных
●R — язык программирования (аналитика, графика)●QGIS — геоинформационная система (картография)●OpenStreetMap — картографический сервис (готовые шаблоны)●LibreOffice — пакет офисного ПО (текущая работа с данными)●Debian GNU/Linux — операционная система
4
Сбор данных
Подготовка
ВИЗУАЛИЗАЦИЯ
Описательнаястатистика
Data Mining
Анализ
«Постаналитика»
Последовательность работы с данными 5
средние значения;минимум;максимум;
изменчивость...ответ на вопрос
«что происходит?»
ассоциация;классификация;
последовательность;кластеризация;
прогнозированиеответ на вопрос
«почему происходит?»
Начало избирательной кампании:сбор информации
6
Начало избирательной кампании:компоновка данных
7
Начало избирательной кампании:состав избирательных комиссий
8
Начало избирательной кампании:состав избирательных комиссий
9
Начало избирательной кампании:состав избирательных комиссий
10
Начало избирательной кампании:состав избирательных комиссий
11
Выборы-2012 Выборы-2014
! От низкой явки выигрывали: Компартія; Україна — Вперед!; Солідарність жінок; Сильна Україна; Опозиційний блок
Результаты голосования:регрессионные зависимости
16
! Несмотря на изначально высокую поддержку, с ростом явки в Харьковской области утрата позиций Оппозиционного блока происходила стремительней
Результаты голосования:закон Бенфорда
18
Результаты голосования:типизация избирательных участков
19
Результаты голосования:типизация территориальных сообществ
20
Результаты голосования:разные результаты «тюрьма-воля»
21
Результаты голосования:электоральная география
22
Подключаем сторонние данные:перепись населения, Государственная служба статистики
23
множественные сравнения!
Несколько уровней абстракции;пересчёты в разных срезах
!Стремитесь к наивысшей детализации исходных данных
24
Выводы
●данных много, полезных знаний в них — тоже много
●агрегация данных из разных источников даёт лавинообразный рост полезных знаний
●нужно стремиться к максимальной детализации данных: усреднённые показатели можно всегда рассчитать самим
●эра «исследовательских институтов» прошла
●навыки, умения и примеры легко найти в интернете
●визуализация и снижение размерности обязательны
25