Презентация powerpointideasfirst.info/wp-content/uploads/2016/10/chubukova.pdf ·...
TRANSCRIPT
Будут ответы на вопросы:1. Что такое кластеризация2. Как проводить кластеризацию3. Кейсы
Если этого окажется недостаточно, то ….
Сегодня не будет: • технических деталей• глубокого погружения в тему
ЧАСТЬ 1
Кто наши клиенты?
?
МУЖЧИНА,
35-60 лет, средний доход,
образование среднее/высшее
ЖЕНЩИНА,25-45 ЛЕТ, ЗАМУЖЕМ, С ДЕТЬМИ ИЛИ БЕЗ, ОБРАЗОВАНИЕ ВЫСШЕЕ ИЛИ НЗ ВЫСШЕЕ
МУЖЧИНА,
ЖЕНЩИНА,
25+, Средний+ доход,
города миллионники
…
?
? ?
? ?
в худшем случае в лучшем случае
ЧАСТЬ 2
Да будет свет
• Кластеризация – это разделение клиентов на группы в зависимости от их
• Кластеризация является частью
технологии, интеллектуального анализа данных
Кластеры
Кластерная структура данных
Солнечная система:
• Центральная звезда
• 8 планет
• более 63 их спутника,
• несколько десятков комет
• большое количество астероидов
Кластерная модель:
• компания
• набор кластеров,
• шумы, выбросы в данных
• мошенники
Клиентский контур – все идентифицированные клиенты
Границы солнечной системы
…
Комета = аномалии, шумы в данных
Характеристики:• Размер• Состав = корзина• Атмосфера =
стиль жизни
Внутренняя часть
Внешняя часть
1
2
У каждой из планет своя орбита. Орбита-это путь, по которому планета движется вокруг Солнца.
Планета = кластер
Расстояние между планетами = Сходство между кластерами
3
4
5
7
6
Мамочки
Проходящие мимо, случайные
Подснежники
Дачники
Внутренняя часть
Внешняя часть
VIP гражданин
Дом-Офис
Таксисты
Дом-Офис
Мамочки
Таксисты
Проходящие мимо, случайные
Характеристика 2
Характеристика 1
Подснежники
VIP гражданин
Дачники
Лидеры
Отстающие
Размер пузырька соответствует размеру кластера (%)
Кластер 1
Кластер 2
Математический метод
Каждый кластер состоит из
, а объекты разных кластеров
.
Исходные «сырые» данные
неизвестной структурыНабор кластеров
– группа клиентов, которые обладают характеристиками. В кластере самое
важное – это « » объектов. Внутри каждого кластера должны оказаться «похожие» клиенты, а клиенты разных кластеров должны быть как можно более .
2. Кластеры до проведения кластеризации . Перечень групп
определяется в процессе работы , математическим методом.
- новое знание о каждом из клиентов
1. Кластеризация четко определяет между клиентами, дает возможность
2. Кластеризация помогает абсолютно посмотреть на клиентскую структуру
и взаимоотношения с клиентом
3. Целью кластеризации является
4. Это как “найти клад в собственном подвале”
ЧАСТЬ 3
Обретаем новые знания
ПРОЦЕСС
сырые данные кластеризированныеданные
А B
и за какой период нужно
анализировать
2. Какой использовать
3. Как оценить кластеризации
кластеров должно быть
обновлять кластеризацию
использовать
может делать кластеризацию
Постановкабизнес задачи
Подготовка данных
Выбор характеристик клиентов
Создание кластерной модели
Интерпретация
Использование результатов и новых знаний
1 2 3 4 5 6
Представление результатов анализа
программное обеспечение для кластеризации
• Провести кластеризацию всех участников программы лояльности
• … всех клиентов
1. актуальные2. полные3. достаточные
чекстоимость
1 товара
количество
товара
названия
товаракорзина
общая сумма
* 10 характеристик клиента из 200. Агрегация за 12 месяцев
Иерархия отсутствует
Изначально определяется набор кластеров, далее объекты (клиенты) попадают в один из кластеров
Изначально все клиенты – одинкластер, далее он последовательно разделяется на кластеры
межкластерноерасстояние
1 2 3 4 5 6 7 8 9 10 11 12
Иерархические методы, отказываются от определения числа кластеров,
а строят полное дерево вложенных кластеров.
иерархических методов кластеризации:
• ограничение объема набора данных
• чувствительны к выбросам (нетипичным клиентам)
:
• их наглядность и возможность получить детальное представление о
структуре данных.
Неиерархические алгоритмы каждому объекту выборки ставят в соответствие номер кластера, т.е. каждый объект принадлежит кластеру
•
•
•
• Количество кластеров определяет кластерную структуру• Показатель качества кластеризации определяет
качество кластеризации
1. Метод 2. Кластерная структура3. Качество кластеризации
иерархические
неиерархические
• К-средних
• Кохонена
Постановка бизнесзадачи
Подготовка данных
Выбор характеристик
Создание кластерной модели
Интерпретация
Использование результатов и новых знаний
Представление результатов анализа
1
2
3корректировка модели кластеризации до получения результата
Наиболее распространенные ошибки кластеризации:
количество переменных
для бизнеса переменные
данных на входе
кластеризации (адекватность
данным)
• Кластеры заранее
•интерпретации
• Может «интересных» результатов
• Может таить в себе ….
Сегментация кластеризация
• Сегменты заранее
•интерпретации
• Результат всегда
1. Кластеризация – это , состоящий из
определенных этапов (CRISP- DM)
кластерной модели:
метод, структура, качество
3. Про построении кластеризации возможны « назад»
4. Кластеризация сегментация
ЧАСТЬ 4
Великая сила
интерпретации
• Интерпретация заключается в переводе таблиц, графиков и чисел в и для
бизнеса знания
• К интерпретации следует подходить
КЛАСТЕР 8:
НЕ ПОКУПАЮТ:
• PUMAПОКУПАЮТ:
ADIDAS
NIKE
Кластеризация – основа для специальных предложений
1 2 3
4 5
• покупатели на 8 кластеров;
• использовались только характеристики
• для каждого кластера
в предпочтениях брендов,
которые невозможно определить экспертным путем
КЛАСТЕР 83027
ПОКУПАТЕЛЕЙ
1 2 3
4 5 6
Характеристики – многомерность (4)
Кластеры (3)
Реальность: m кластеров * n характеристикN – мерное пространство
Выберите 2 «свои» оси из всего многомерного пространства характеристик клиентов
Эти характеристики должны:
1. быть важными для бизнеса
2. максимально характеризовать изменчивость данных (с точки зрения кластеров)
Частота
• Типичные кластеры• Размер кластеров• Выбросы
Выручка
Находим закономерности:
• Казалось бы очевидные - как мы раньше про это не подумали?
• Совершенно неочевидные - не может быть… почему? И что это значит….
. Кто реальный клиент компании: типичные портреты или «типажи» + подходящее название кластера
2. Какова различных групп клиентов и их среди клиентов
3. Какие клиентов у нас на самом деле (а мы думаем что они есть)
4. Каких покупателей компания
5. Кого нам следует
6. Кто наши « клиенты»
7. Должно появиться еще больше и много относительно клиентов
ИНТЕРПРЕТАЦИЯ
ЭТО ТВОРЧЕСКИЙ ПРОЦЕССПРЕВРАЩЕНИЯ ДАННЫХ, ЧИСЕЛ, ГРАФИКОВ
В ПОНЯТНЫЕ, ПОЛЕЗНЫЕ И ЗНАЧИМЫЕ ДЛЯ БИЗНЕСА ВЫВОДЫ
КАЧЕСТВЕННУЮ ИНТЕРПРЕТАЦИЮ НЕ СДЕЛАЕТ КОМПЬЮТЕР
ЧАСТЬ 5
Кейсы
не покупают
• Товары для животных• Свежевыжатые соки
• Товары для детей• Дом/сад• Мясо и молоко• Овощи фрукты• Свежая выпечка• Пиво
одна покупка
• небольшое число
позиций
• низкий средний чек
все покупки за период
• число
категорий,
•корзина
%
не покупают
%
одна покупка
• небольшое число
позиций
• низкий средний чек
все покупки за период
• число
категорий,
•корзина
• товары для детей
• пиво
• дом/сад
• мясо и молоко• овощи фрукты
• свежая выпечка• товары для
животных• свежевыжатые
соки
• Разработка новой концепции Программы лояльности
• Тестирование целевых кампаний, откликов и ROI
• Тестирование кластеризации как нового принципа работы с целевымипредложениями
Выбрана 2-х шаговая модель:- наиболее равномерно распределенная с точки зрения
размеров кластеров- число кластеров = 6 (оптимальное число кластеров)- достаточное качество модели (>0,5)
cluster-3
cluster-4
cluster-5
cluster-6
cluster-8
-
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
- 5 10 15 20 25 30
av
era
ge
tra
nsa
ctio
n a
mo
un
t, U
AH
Number of transactions
«проходящие мимо», приверженцы конкурентов, «социальные», малообеспеченные, не сенсетивные к промо
эталонные, ценные и лояльные, «полнокорзиночники»
нестабильная группа с высокой вероятностью оттока
редкие, любители плановых закупок
ценные, сенсетивные к промо, осознанные покупатели
Серединное ядро
Родители , мамочки
Хронические больные
Проходящие мимо, случайные
Здоровый образ жизни
Пенсионеры
Средний чек
Частота
Косметика
•
•
•
•
%.
%
•
•
•
•
•
Постановка бизнесзадачи
Подготовка данных
Выбор переменных
Создание кластерной модели
Интерпретация
Использование результатов и новых знаний
Представление результатов анализа
1
2
3 обновление модели
Серединное ядро
Родители , мамочки
Хронические больные
Проходящие мимо, случайные
Здоровый образ жизни
Пенсионеры
Средний чек
Частота
Косметика
Кластер Серединное ядро• Влияние кризиса: уменьшение корзины, стали покупать только
медикаменты, уменьшили траты на открытую зону• Новая задача : расширить корзину, растянуть на кластеры, определить
специализацию• После повторной кластеризации подтвердилась правильность
работы маркетинга
Серединное ядро
Родители , мамочки
Хроническиебольные
Проходящие мимо, случайные
Здоровый образ жизни
Пенсионеры
Средний чек
Частота
Косметика
• Самые уязвимые сегменты, самые дорогостоящие препараты, зависимы от лекарств• Задача: Удержание и расширение корзины: фито, натуральные препараты• Работа: Постоянная работа с кластером, коммуникация, диагностика, спец
мероприятия, пост замеры на платной основе, в 3 раза дешевле чем в поликлинике. После повторной кластеризации подтвердилась правильность работы маркетинга
• Корректировка маркетинговой клиентской стратегии
• Разработка плана целевых кампаний
• Запуск целевых кампаний
• Контроль баланса кластеров и общей структуры клиентского актива
После проведения кластеризации мы совершенное по-другому посмотрели на нашклиентский актив, определили ключевые кластеры и нашли совершенно неожиданные группы клиентов.
По результатам всего проекта мы пересмотрели нашу клиентскую и коммуникационную стратегию и часть ассортиментной политики.
Семен РомановРуководитель Программы лояльности
«Мозаїка»
Фокус
Насколько хорошо
сегмент приведен
в соответствие со стратегией
CLV, ценность клиента
IBM SPSS ModelerSAS Enterprise Miner
• Deductor• Orange• Kmine• Rapid Miner
• R • Matlab
Аналитические сервисы SQL Server, MS Excel
Команда:
1. Аналитик
2. ИТ
3. Маркетинг / подразделение ПЛ
Артур Миддлтон Хьюз.
Маркетинг на основе баз данных Билл Фрэнкс
Укрощение больших данных
Том Дэвенпорт и Джон
Харрис. Аналитика как
конкурентное преимущество
Ирина Чубукова