parcours big data @ cetic (6 mai 2014)

16
Parcours Big Data Conclusions et ressources. Parcours Big Data Cetic | 06/05/2014 | @awtbe

Upload: digital-wallonia-agence-du-numerique

Post on 20-Aug-2015

500 views

Category:

Data & Analytics


1 download

TRANSCRIPT

Page 1: Parcours Big Data @ Cetic (6 mai 2014)

Parcours Big DataConclusions et ressources.

Parcours Big Data Cetic | 06/05/2014 | @awtbe

Page 2: Parcours Big Data @ Cetic (6 mai 2014)

Introduction technique• Vieille histoire, mais stockage rare et cher. • Coût du stockage et capacité de traitement ne sont

plus un problème.• Bond technologique par les acteurs d’Internet :

Google, Amazon, Microsoft, Twitter, … & IOT, industrie, …

• Tout le monde n’a pas la puissance de Facebook … mais peut bénéficier de leur expérience.

• 3 … 6 V : Vitesse, variété, volume, … et visualisation, véracité, valeur.

• Exemple : www.memoiredepatrimoine.com• Stéphane Mouton @smouton de @CETIC

Page 3: Parcours Big Data @ Cetic (6 mai 2014)

Volume des données• Nous produisons tous des données. Explosion en

2020 avec l’Internet of Everything• Problèmes liés au Volume : temps de traitement des

data, complexité des algorithmes• Nouvelles idées business // auxquelles l’IT doit

répondre (exploration, analyse, vue à 360°, …).• Exemple : analyse de données d’une banque

-> les clients fuient à cause d’une amende-> action business.

• Hadoop … solution Open Source héritée de l’expérience de Google.

• Une solution « unique » impossible. Compléter.• Eric Charles @echarles de @datalayerio

Page 4: Parcours Big Data @ Cetic (6 mai 2014)

Vitesse des données• On est dans un flux de données, mais on en perd

trop … Catch ‘em all !• Pas nouveau (finance, téléphonie, énergie, SCM, …),

mais plus de flux, plus rapide (social, IOT, jeux, …).• Technologies : agile, lean, distributed computing,

Cloud, functional programming, lambda architecture.• Spark-Streaming (airbnb, amazon, Twitter), Storm

(Twitter), S4 (Amazon), Kafka + Sanza (Linkedin), …• Exemples : qualité, environnement, optimisation de la

production, SAV, capacity planning, marketing.• Andy Petrella @noootsab de @NextLab_be• http://slides.com/noootsab/bdw14

Page 5: Parcours Big Data @ Cetic (6 mai 2014)

Variété des données• Variété (diversité) : contenu (chiffres, multimédia,

texte, …), format (html, txt, pdf, …), structuration (BD, markup, non structuré, source (gov, entreprises, crowd, IOT, logs, quantified self, …), …

• 80% des données produites = non structurées.• 7ème V : variabilité <> variété … data apparemment

similaires, mais avec un sens différent.• Challenges : identifier, comprendre, extraire, stocker,

informer.• Open Data : Publish & Share (CKAN), Transform

(DataTank), Explore and visalise (Data Unity).• Fabrice Estiévenart @fab_estievenart de @CETIC

Page 6: Parcours Big Data @ Cetic (6 mai 2014)

Qualité des données• L’ennemi des SI : le temps. Données en retard.• Complétude. Tenter de décrire au mieux la réalité.• Evolution des SI : structuré (Microsoft : 150 millions

d’entreprises à gérer = 1 mois de retard) > non structuré (Internet).

• USA : mauvaise qualité des données : 600 millions $.• 80 % des coûts des SI = contenu.• 67 zetabytes arrivent tous les ans sur nos rétines.

Qu’en retient-on ?• Défis : Comprendre les données (sémantique) et gérer

les droits d’utilisation.• Dominique Orban Rever http://www.rever.eu

Page 7: Parcours Big Data @ Cetic (6 mai 2014)

Adapter l’infrastructure IT• Comment du concept à la réalité technique ?• De plus en plus de données, d’utilisateurs, d’usages, …

le système ne suit plus !• Not blade servers, not virtualized,

not highly oversubscribed, not SAN/NAS.• High performance & scaling. High availability.

Ease of (rapid) deployment. Comprehensive manageability. Coexistence with existing applications. Service & support.

• IT Data Center // Dedicated Pod.• Hugues De Pra @hdepra de @Cisco_BE

Page 8: Parcours Big Data @ Cetic (6 mai 2014)

Aspects juridiques du Big Data• … quelques aspects juridiques ;-)• Traitement des données : loi du 30/12/92 sur la vie

privée.• Protection des données à caractère personnel …

comme une adresse IP !• Plein de données pour faire plein de choses … oui,

mais il faut informer les sujets, vérifier les bases légales, déclarer les données, …

• Protection du contenu : loi du 31/08/1998 sur la protection des bases de données.

• Open Data : Directive PSI.• Philippe Laurent @Ph_LAURENT

Page 9: Parcours Big Data @ Cetic (6 mai 2014)

Etude de cas 1. Trasys

• Maintenance prédictive.• Création de « patterns » qui permettent des

prédictions et des actions. Ces patterns sont regénérées en fonction des nouvelles données produites.

• Modèles de régression, de classification, d’association et de clustering.

• Solutions prédictives = valeur business.• Michel Mans de www.trasys.be

Page 10: Parcours Big Data @ Cetic (6 mai 2014)

Etude de cas 2. Swan Insights• Data Driven Society. On ne peut plus ignorer les data

pour prendre des décisions.• Data Operating System … DOS ;-)• Pont entre les données non structurées du monde réel

et les processus décisionnels des entreprises.• Exemple : sales & marketing. Données sociales :

analyse des connexions et création de clusters par algorithmes (recherche fondamentale). Caractérisation personnelle. Segmentation des clients.

• DataGraph : http://swaninsights.com/the-datagraph/• Laurent Kinet @laurentkinet de @SwanInsights

Page 11: Parcours Big Data @ Cetic (6 mai 2014)

Etude de cas 3. Infopôle

• Création d’une 7ème grappe Infopôle Cluster TICsur le Big Data.

• User group incluant la demande et l’offre dans le Big Data. En lien avec la plateforme PFI Big Data wallonne.

• Collaboration avec un projet Big Data européen.• Frédéric Jourdain @FredoJourdain de @Infopole

Page 12: Parcours Big Data @ Cetic (6 mai 2014)

Défi ?

• 94 % des entreprises en Wallonie <= 4 personnes.• De leur capacité à gérer et analyser le Big Data

dépend la compétitivité des entreprises, des organisations et des territoires.

• Comment faire “descendre” le Big Data au niveau des TPE / PME en Wallonie ?

• Quelles solutions ? Comment (in)former les entreprises ?

Page 13: Parcours Big Data @ Cetic (6 mai 2014)

Major ICT trends

ProgrammableWorld

Source : Master Plan TIC & AWT

Page 14: Parcours Big Data @ Cetic (6 mai 2014)

Ressources BigData @ awt.be• Big Data. La révolution des données.

Volume infini, temps réel et formats déstructurés caractérisent les données du Big Data. De leur capacité à gérer et analyser ces données dépend la compétitivité des entreprises, des organisations et des territoires.

• Assises du Big Data et lancement d'une plateforme d'innovation Big Data en Wallonie.Le 13/12/2013, avec la Wallonie, l'AWT, le CETIC, NRB et les Pôles de compétitivité, l'Infopôle Cluster TIC a organisé les Assises du Big Data. L'occasion d'annoncer une plateforme d'innovation Big Data pour la Wallonie.

Page 15: Parcours Big Data @ Cetic (6 mai 2014)

Plateforme ICT• Les entreprises du Big Data en Wallonie.

Cartographie des entreprises wallonnes du secteur ICT actives dans le Big Data ou le Web sémantique.

Page 16: Parcours Big Data @ Cetic (6 mai 2014)

Contacts et infosAndré [email protected] | www.awt.bewww.awt.be/bigdataopendata.awt.bewww.slideshare.net/awt@unpeudeblabla

www.twitter.com/awtbewww.facebook.com/awtbewww.awt.be/web/rsswww.youtube.com/user/awtbe