vers une approche de sécurisation des entrepôts de données en utilisant les réseaux bayésiens
TRANSCRIPT
Vers une approche de sécurisation des entrepôts de données en
utilisant les réseaux Bayésiens
1JRBA 2010
1ère Journée sur les Réseaux Bayésiens et leurs Applications
Salah TrikiHanene Ben-Abdallah, Jamel Feki (FSEGS)
Nouria Harbi (Université Lyon 2)
Plan
Conclusion et perspectives
Proposition pour la sécurisation des ED
Sécurisation des entrepôts de données
Introduction
2JRBA 2010
Plan
Conclusion et perspectives
Proposition pour la sécurisation des ED
Sécurisation des entrepôts de données
Introduction
3JRBA 2010
Un entrepôts de données est une collection de données : intégrées, orientées sujet, non volatiles, historisées, disponibles pour l’interrogation et l’analyse
Les analyses concernent différents domaines: Commerce, Hospitalier …
4
Conclusion et perspectives
Proposition pour la sécurisation des ED
Introduction Sécurisation entrepôts de données
JRBA 2010
ETLExtraction
TransformationChargement
Outils d’analyse
Sources de données
Entrepôtde
Données
Conclusion et perspectives
Proposition pour la sécurisation des ED
Introduction Sécurisation entrepôts de données
5
Architecture
- Augmenter le chiffre d’affaires- Réduire les dépenses- Prévoir un stock de médicaments pour une période donnée de l’année
JRBA 2010
Les entrepôts de données contiennent : Des données sensibles Certaines données personnelles
Exigences légales: HIPPA GLBA Sarbanes-Oxley Safe Harbor
Les organismes doivent respecter ces lois
Conclusion et perspectives
Proposition pour la sécurisation des ED
Introduction Sécurisation entrepôts de données
6JRBA 2010
Plan
Conclusion et perspectives
Proposition pour la sécurisation des ED
Sécurisation des entrepôts de données
Introduction
7JRBA 2010
8
Deux classes de sécurité : La sécurisation des opérations:
• Contrôler l’accés aux données • Baser sur des règles d’accés
La prévention contre les inférences :• Interdire la déduction des données cachées à
partir des données accessibles
Conclusion et perspectives
Proposition pour la sécurisation des ED
Sécurisation des entrepôts de données
Introduction
JRBA 2010
L’inference est basée sur : Des informations La connaissance de la structure de l’ED
Objectif d’un utilisateur malicieux : Inférer une information sensible
Moyens utilisés par un utilisateur malicieux : Un ensemble d’informations Un ensemble de requêtes
Conclusion et perspectives
Proposition pour la sécurisation des ED
Introduction
9
Sécurisation des entrepôts de données
JRBA 2010
Plan
Conclusion et perspectives
Proposition pour la sécurisation des ED
Sécurisation des entrepôts de données
Introduction
10JRBA 2010
11
Traiter les requêtes de type Max ou Min
Exemples de requêtes de type Max: Maximum des ventes par mois et par région Maximum du chiffre d’affaires par région et
par fournisseur Maximum des commissions par employé et
par année
Conclusion et perspectives
Sécurisation des entrepôts de données
Proposition pour la sécurisation des ED
Introduction
JRBA 2010
12
Approche Max RécupérerMaxRequête (Requête)data RécupérerDataRequête (Requête)RB ConstruireRéseauxBayésiens (data , Max)Si (∃ Nœud ∈ RB /Pr (Nœud=Max )> seuil) ALORS
Interdire la requête
SINON
Autoriser la requête
FINSI
Conclusion et perspectives
Sécurisation des entrepôts de données
Proposition pour la sécurisation des ED
Introduction
JRBA 2010
Construction du réseau Bayésien
D1=900
D2=500
D3=700
D4=200
D5=300
Max (D1, D2, D3, D4,
D5) = 900
Max (D4, D5)
=300
Pr1 = 1/5 Pr 2 = 1/5 Pr3 = 1/5 Pr4 = 1/5 Pr5 = 1/5Pr2 = 1/3Pr1=1/3 Pr3 = 1/3
Max (D2, D3)
=700
Pr1 = 1
D1=900
13 / 22
Conclusion et perspectives
Sécurisation des entrepôts de données
Proposition pour la sécurisation des ED
Introduction
JRBA 2010
ALICE BOB
Décembre 2009ALICE est malade
Habilités à faire des transactions internationales.
Est-il possible d'inférer le nom de l'employé du département Marketing ayant eu la commission maximale ?
ExempleDépartementMarketing
Chaque employé de l’entreprise reçoit une commission sur les transactions qu’il effectue
Deux types de transactions:-Nationales-Internationales
14 / 22
Conclusion et perspectives
Sécurisation des entrepôts de données
Proposition pour la sécurisation des ED
Introduction
Nombre d’employés du département Marketing : 4
JRBA 2010
Maximum des commissions par Nombre d'employés et par Département
NB_EMP DEPT_ID Max Commission
4Marketing 900
Finance 950
15 / 22
Conclusion et perspectives
Sécurisation des entrepôts de données
Proposition pour la sécurisation des ED
Introduction
JRBA 2010
Maximum des commissions par Année et par Mois
Année Mois Max Commission
2009
Octobre 850
Novembre 720
Décembre 900
Le maximum des commissions du département Marketing est obtenu au mois de Décembre
16 / 22
Conclusion et perspectives
Sécurisation des entrepôts de données
Proposition pour la sécurisation des ED
Introduction
JRBA 2010
Maximum des commissions par Année et par Type de commission
Année Type de commission Max Commission
2009Nationale 840
Internationale 900
Le maximum des commissions du département Marketing est obtenu au mois au de Décembre sur une transaction internationale
BOB est l’employé qui a obtenu le maximum des commissions
17 / 22
Conclusion et perspectives
Sécurisation des entrepôts de données
Proposition pour la sécurisation des ED
Introduction
JRBA 2010
840 420 440 500 520 740 850 720 0
900
900
Pr = 1/10
Pr = 1/2
Commission de ALICE
Commission de BOB
720
850900Pr = 1/4
840 900
900
18 / 22
Conclusion et perspectives
Sécurisation entrepôts de données
Proposition pour la sécurisation des ED
Introduction
L a dernière requête doit être interdite
JRBA 2010
Avantages Pas de traitement supplémentaire après
l’alimentation de l’ED Pas d’altération des données originaux
Inconvénient Temps de calcul important
19 / 22
Conclusion et perspectives
Sécurisation des entrepôts de données
Proposition pour la sécurisation des ED
Introduction
JRBA 2010
Plan
Conclusion et perspectives
Proposition pour la sécurisation des ED
Sécurisation des entrepôts de données
Introduction
20 / 22JRBA 2010
Les travaux sur la prévention des inférences se basent sur l’alteration des données originales
Utilisation des notions de probabilités afin de détecter les cas d’inférences
Alléger le travail du réseau Bayésien : Utiliser les profils des utilisateurs Utiliser les méthodes statistiques afin de
détecter les données sécurisées
Proposition pour la sécurisation des ED
Sécurisation des entrepôts de données
Conclusion et perspectives
Introduction
21 / 22JRBA 2010
Merci pour votre attention
JRBA 2010