Откривање законитости у подацима (data...

36
Откривање законитости у подацима (Data Mining) Факултет организационих наука Центар за пословно одлучивање

Upload: others

Post on 27-Jul-2020

12 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Откривање законитости у подацима (Data Mining)

Факултет организационих наука

Центар за пословно одлучивање

Page 2: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

П4: DM Задаци

• Пословни проблеми

• Случајеви (Моб. телефонија, ГСС, DELL)

• Задаци дејта мајнинга

Page 3: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Циљеви предавања

• Препознавање стандардних проблема пословања

• Препознавање задатака ДМ

• Увод у процес откривања знања

Page 4: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

ОЗП дефиниција

Дејта мајнинг (срп. Откривање законитости у подацима) је процес oтркивања

законитости у великој количини података користећи математичке, статистичке и

оптимизационе методе и технике.

Page 5: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Случај 1: Моб. телефонија

Компанија Т је најстарија компанија моб. телефоније у САД. Има највећи број

корисника и тржишно учешће од око 70%. На тржиште су почели да улазе и други

моб. оператери, и компанија је почела да губи свој тржишни удео. Све више

корисника узима услуге других оператера. Изгубљено је 5% корисника и претпоставља

се да ће тренд да се настави.

Page 6: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Случај 1: Моб. телефонија

Компанија Т не жели да губи више корисника и спремна је да побољша квалитет своје

услуге и да се суочи са новонасталим проблемима. Т води податке о својим

корисницима и то:

1. Податке о рачунима (задужења, плаћања, врсте услуга)

Page 7: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Случај 1: Моб. телефонија

1. Како Т може да унапреди своје пословање?

2. Да ли Т познаје свог клијента?

Page 8: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Пример уз случај 1: Подаци о кориснику

• Држава: категорички, 50 САД држава и Колумбија дистрикт

• Дужина рачуна: целобројни, колико је дуго рачун активан

• Код области: категорички

• Тел. број: део кључа за рачун

• Секретарица: биномни, да или не

• Укупна минута на дан: континуални, потрошени минути

• Укупан број позива: целобројни

• Укупно дневно задужење: континуални, базиран на претходна два

• Укупнио интернационалних минута: континуални,потрошени минути

• Укупан број интернационалних позива: целобројни

• Укупно интернационални задужење: континуални

• Број позива ка корисничком сервису: целовбројни тип

Page 9: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Дистрибуција атрибута

Page 10: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Дистрибуција атрибута (пример)

Page 11: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Дистрибуција атрибута (пример)

Page 12: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Дистрибуција атрибута

Page 13: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Дистрибуција атрибута

Page 14: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Дистрибуција атрибута

Page 15: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Дистрибуција атрибута

Page 16: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Подаци

Page 17: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Корелација података

Page 18: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Статистика

Page 19: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Статистика

Page 20: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Случај 2: Горска служба спасавања

Горска служба спасавања се бави спасавањем унесрећених лица на тешко приступачним теренима. Главна делатност ГСС-а током

зиме су ски патроле на Копаонику и Старој планини, а од 2008. године и на Златибору и Дивчибарима. ГСС прикупља податке о

повредама и уноси их у своју базу и на основу ње сваки дан предаје извештај

скијалишту о повредама.

Page 21: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Случај 2: Повредна листа

1. Подаци о спашеном (лични подаци)

2. Подаци о повреди (тип, локација, време, врем. услови, врста транспорта, врста помоћи, опрема)

3. Подаци о спациоцу (лични, службени)

Page 22: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Случај 2: ГСС

ГСС има жељу да унапреди скијашки спорт, у смислу, смањивања броја повреда, јер

сматра да има искуства и податке који им могу помоћи да то учине. С обзиром да је све више људи заинтересовано за скијање

и сноуборд и пошто је све већи број планина потребно покрити, ГСС жели да

смањи број повреда.

Page 23: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Случај 2: Питања

1. Које акције ГСС треба да предузме да би унапредио скијашки спорт?

2. Да ли му подаци о повредама могу помоћи при томе?

3. Како се може помоћи скијашима у превенцији повреда? Да ли је ово

узалудан задатак?

Page 24: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Пословне примене [TWM: Data and Text Mining]

1. Лојалност бренду и понашање купаца

2. Компетитивна предност

3. Моделовање одлучивања потрошача

4. Кредитна способност и откривање превара

5. Управљање односима са потрошачима

6. Директни и маркетинг на основу БП

7. Анализа потршачке корпе

Page 25: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Пословне примене

8. Моделовање одзива тржишта и предвиђање продаје

9. Сегментација тржишта

10. Политика цена

11. Позиционирање производа

12. Управљање информацијама

Page 26: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

DM задаци

1. Редукција,

2. Процена (Регресија),

3. Класификација,

4. Кластеровање,

5. Предвиђање, и

6. Откривање асоцијативних правила

(АКО-ТАДА).

Page 27: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Редукција

1. Редукција атрибута

1. Шта се дешава ако се у модел не укључи одређени атрибут?

2. Шта се дешава уколико се у модел укључи битан атрибут?

2. Редукција случајева

Page 28: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Процена (Регресија)

1. Позвао сам 50 људи на прославу, колико пића би требао да набавим?

2. Ресторан припрема јела, колико од сваког јела треба да буде унапред припремљено?

Page 29: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Класификација

1. На који начин банка одлучује да даје кредит?

2. На који начин се на основу крвне слике одређује да ли је неко болестан или није?

Page 30: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Кластеровање

1. Који сегменти потрошача постоје?

2. Које групе студената постоје?

3. Како се групишу компаније у једној привреди?

Page 31: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Предвиђање

1. Која ће бити температура сутра?

2. Како ће се кретати цене акција за десет дана?

3. Ко ће да победи на светском првенству у фудбалу?

Page 32: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Асоцијативна правила

1. Ако купац купује Зајечарско пиво, тада ће купити и Домаћински чипс.

2. Ако запослени шаље више од 5 мејлова на сат не стиже да испуни своје радне задатке.

Page 33: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Примери Бостон Селтикси би желели да процене колико ће поена наредни противник да постигне против њих. Војни обавештајац жели да сазна о односу Чијата и Сунита у одређеном стратешком подручју. НОРАД одбрамбени рачунар треба да одлучи тренутно да ли је трептај на радару јато гусака или нуклеарни пројектил.

Page 34: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Примери

Политичар тражи најбољу групу да га подржи у одређеном округу донацијама.

Обевештајац жели да утврди да ли одређена секвенца (редослед) потеза на финансијском тржишту представља претњу терористичког напада.

Вол стрит аналитичар је замољен да анализира очекиване промене у цени акцији за скуп компанија са сличним рациом цена/принос.

Page 35: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

DM задаци и алгоритми

1. DM задаци стварају потребу за DM. Задаци представљају део свакодневног одлучивања ДО.

2. DM алгоритми решавају DM задатке. Они служе за откривање патерна (законитости).

Page 36: Откривање законитости у подацима (Data Mining)odlucivanje.fon.bg.ac.rs/wp-content/uploads/04ZadaciOzp.pdfDM задаци и алгоритми 1. DM задаци

Следећи пут

• ОЗП алгоритми кластеровања и асоцијације