dark and dirty data

17
DARK DATA AND DIRTY DATA Dwie ciemne strony danych - Big Data 26.04.2016 Kontakt Dane rejestrowe Cloud Technologies S.A. Kruczkowskiego 2 00-412 Warszawa +48.22.535.30.50 [email protected] www.cloudtechnologies.pl Cloud Technologies S.A. ul. Żeromskiego 7 05-075 Warszawa KRS: 0000405842 NIP: 9522106251 REGON: 142886479 Kapitał zakładowy: 460.000,00 zł Sąd Rejonowy dla m.st. Warszawy w Warszawie XIII Wydział Gospodarczy Krajowego Rejestru Sądowego ul. Czerniakowska 100, 00-454 Warszawa

Upload: maciek-sawa

Post on 28-Jan-2018

73 views

Category:

Data & Analytics


0 download

TRANSCRIPT

DARK DATA AND DIRTY DATA

Dwie ciemne strony danych - Big Data

26.04.2016

Kontakt Dane rejestrowe

Cloud Technologies S.A.Kruczkowskiego 200-412 Warszawa

+48.22.535.30.50biuro@cloudtechnologies.plwww.cloudtechnologies.pl

Cloud Technologies S.A.ul. Żeromskiego 705-075 Warszawa

KRS: 0000405842NIP: 9522106251REGON: 142886479

Kapitał zakładowy: 460.000,00 złSąd Rejonowy dla m.st. Warszawy w Warszawie XIII Wydział Gospodarczy Krajowego Rejestru Sądowegoul. Czerniakowska 100, 00-454 Warszawa

26.04.2016

Dark & Dirty Data

Według IDC

90% danych w internecie to Dark Data

Pozostałe 10% to Dirty Data

26.04.2016

Implozja Big Data

W 2020 roku internet będzie kilka razy większy. Dzisiaj liczy 6 ZB (zetaba-jtów) danych.

Za 5 lat internet będzie liczył 45 ZB.

Według Oracle internet rozrasta się w dane 40% rocznie.

kilobajtmegabajtgigabajtterabajtpetabajteksabajtzettabajt

kBMBBGTBPBEBZB

10 = 100010 = 1000 10 = 100010 = 100010 = 100010 = 100010 = 1000

Wielokrotność bajtów

26.04.2016

Digital Dark Age

Era Dark Data

czyli danych nieuporzadko- wanych, nieustrukturyzowanych, nieprzetworzonych, surowych jest dziś największym wyz-waniem.

Nie wiadomo co w sobie kryją i co możemy odkryć. Może to być puszka pandory lub jak garnek złota na końcu tęczy.

26.04.2016

Skala Dark Data

26.04.2016

Na zaś, na zapas, na wszelki wypadek...

Często firmy gromadzą dane na wszelki wypadek, na zapas, na później łudząc sie ze przyjdzie czas na ich analizę. Równie czesto ignorują dark data i nie wiedzą jak się do nich zabrać lub widząc w takim przedsięwzięciu syzyfową pracę...

26.04.2016

1Dane, o których istnieniu przed-siębiorstwo nie zdaje sobie sprawy, więc ich nie gromadzi, ani nie przetwarza.

2Dane, o których przedsiębior- stwo wie i je gromadzi ale nie ma pojęcia jak je przetworzyć.

3Dane, o których przedsiębior- stwo wie i je gromadzi a nawet dysponuje narzędziami do ich analizy lecz nie podejmuje się ich analizy, ponieważ uznaje ją za zbyt kosztowną lub obawia się, że rezultaty będą nie- współmierne z nakładem pracy.

Dark Data wg Cloud Technologies

26.04.2016

Zmarnowany potencjał, cy-frowy bełkot, jak brudna plama na tkaninie, którą jest Big Data. Dirty Data zanieczyszczają wartościowe Big Data, takie jak informacje o gustach, inten- cjach, zainteresowaniach czy zachowaniach internautów.

Dirty Data

26.04.2016

Źródła Dirty Data

Najciemniej pod latarnią… Facebook (lajki, komentarze, tagi, hashtagi z fanpage’y).

Dirty Data wprowadzaja w błąd i dostarczaja pesudo wiedzy.

26.04.2016

Baaaaaaardzo dużo danych...

Każdej minuty, każdego dnia...

Facebookużytkownicy polubili 4,166,667 postów

Twitterużytkownicy wysłali 347,222 tweetów

Youtubeużytkownicy wgrali 300 godzin filmów

Skypeużytkownicy wykonali 110,040 telefonów

Instagramużytkownicy polubili 1,736,111 zdjęć

Źródło: https://www.domo.com/blog/2015/08/data-never-sleeps-3-0/

26.04.2016

Dirty job

26.04.2016

Rozwiązanie problemu przez Cloud Technologies

Antibot AntiFraud AdBlock detection

26.04.2016

Data Management Platform

Behavioralengine.com

to platforma zarządzania danymi (Data Management Platform).

Zwiększa skuteczność reklamy internetowej.

Pozwala zdobyć wiedzę o użytkownikach.

Optymalizuje sprzedaż on-line.

Wzbogaca systemy CRM.

Przykładowe segmenty:

biznes (np. podatek, umowa, pit, dokument, zus, rynek...)

dom (np. dom, kuchnia, gaz, dach, schody, architektura...)

edukacja (np. matematyka, nauczyciel, matura, profesor, sprawdzian, studia...)

agd (agd kuchenne, agd gos-podarcze)

26.04.2016

25M+ UU Ogólne zainteresowania

40M+ UUDemografia

15M+ UUIntencje zakupowe

Segmenty & DSP

26.04.2016

Cloud Technologies w liczbach

43 pracowników

500K+ witryn internetowych

100M+ plików cookie

322M+ PLNaktualna kapitalizacja

33,5M PLN przychodów ‘15

15M PLNzysku netto ‘15

26.04.2016

Wyróżnienia

26.04.2016

Dziękuję za uwagę.

Maciej SawaChief Commercial Officer

[email protected]