structures de données avancées : sdds (structures de données distribuées et scalables)

17
Structures de données avancées : SDDS (structures de données distribuées et scalables) D. E ZEGOUR Institut National d ’Informatique

Upload: unity-pope

Post on 15-Mar-2016

51 views

Category:

Documents


7 download

DESCRIPTION

Structures de données avancées : SDDS (structures de données distribuées et scalables). D. E ZEGOUR Institut National d ’Informatique. Sdds : - Systèmes distribués -. Définition  Un ensemble de machines se partageant les données à stocker et la charge CPU. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

Structures de données avancées : SDDS (structures de données distribuées et scalables)

D. EZEGOURInstitut National d ’Informatique

Page 2: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

DéfinitionDéfinition

 Un ensemble de machines se partageant les données à stocker et la charge CPU.

Les tâches de communication inter-machines sont transparentes à l’utilisateur,

L’ensemble du système apparaît comme une seule machine virtuelle.

Sdds : - Systèmes distribués -Systèmes distribués -

Page 3: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

Architecture à Mémoire Partagée : Shared-MemoryArchitecture à Mémoire Partagée : Shared-Memory

Processeurs indépendant avec une mémoire communeProcesseurs indépendant avec une mémoire commune

Limité à une dizaine de processeurs ( La mémoire devient un goulot Limité à une dizaine de processeurs ( La mémoire devient un goulot d’étranglement)d’étranglement)

L’ajout d’un nouveau processeur peut entraîner des modifications L’ajout d’un nouveau processeur peut entraîner des modifications importantes au niveau du matériel importantes au niveau du matériel

Sdds : - Architectures Matérielles -Architectures Matérielles -

Page 4: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

Architecture à Disques Partagés : Shared-DiskArchitecture à Disques Partagés : Shared-Disk

Chaque processeur a sa mémoire privée et peut accéder à n’importe Chaque processeur a sa mémoire privée et peut accéder à n’importe quel disque à travers un réseau d’interconnexion quel disque à travers un réseau d’interconnexion

Chaque processeur peut ainsi copier des pages d’une base de données Chaque processeur peut ainsi copier des pages d’une base de données sur un disque partagé dans son propre cache disque. sur un disque partagé dans son propre cache disque.

Nécessite une gestion des conflits d’accès aux même pages et Nécessite une gestion des conflits d’accès aux même pages et l’implantation d’un protocole de gestion de cohérence des caches.l’implantation d’un protocole de gestion de cohérence des caches.

La complexité de ces mécanismes limite les performances de cette La complexité de ces mécanismes limite les performances de cette architecture. architecture.

Sdds : - Architectures Matérielles -Architectures Matérielles -

Page 5: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

Architecture sans partage : Shared-NothingArchitecture sans partage : Shared-NothingChaque processeur dispose de sa propre mémoire locale et de son Chaque processeur dispose de sa propre mémoire locale et de son propre espace disque ( Chaque nœud apparaît comme un serveur de propre espace disque ( Chaque nœud apparaît comme un serveur de données local avec sa propre base de données)données local avec sa propre base de données)

Cette architecture s’est développée grâce aux réseaux de PCs et de Cette architecture s’est développée grâce aux réseaux de PCs et de stations de travail qui permettent d’intégrer un grand nombre de stations de travail qui permettent d’intégrer un grand nombre de processeurs (plusieurs centaines, voire des milliers de processeurs). processeurs (plusieurs centaines, voire des milliers de processeurs).

Extensibilité et disponibilité très séduisantes. Extensibilité et disponibilité très séduisantes.

Minimiser la quantité de données transférées sur le réseau.Minimiser la quantité de données transférées sur le réseau.

Ces systèmes sont cependant difficiles à administrer et à programmer.Ces systèmes sont cependant difficiles à administrer et à programmer.

Sdds : - Architectures Matérielles -Architectures Matérielles -

Page 6: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

Stockage sur un seul site Limite de taille

Mécanisme de calcul d'adresse unique et centralisé un point d'accumulation

– Limite sur les performances d'accès– Vulnérabilité aux pannes– Pas de Scalabilité

Serveurs

Clients

Répertoired'accès

Sdds : - Structures de données classiques -

Page 7: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

Schémas de distribution classiques :– Partitionnement par intervalle, – Partitionnement par hachage– Round-Robin , …

Sdds : - Structures de données classiques -

Page 8: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

Sdds : - Scalable distributed data structures -

Une nouvelle classe de structures de données pour des bases de données modernes

SDDS Conçues spécifiquement pour les multiordinateurs d’une grande

taille– Avec des données multimedia, géographiques, texte,…

Assure la Scalabilité– Grandissant rapidement en gardant les mêmes performances

Assure une haute disponibilité

Page 9: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

Une collection faiblement couplés d'ordinateurs :– Station de travail, PC, CPU

Interconnectés par un réseau haut-débit (≥ 100 Mb/s)  :– LAN (Local Area Network), WAN(Wide Area Network), …– Architecture à partage de rien avec passage de messages : – Unicast, Multicast et Broadcast

Sdds : - Multiordinateurs – définitions -

Page 10: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

A

D

B

CInter réseau

Sdds : - Multiordinateurs – définition -

Page 11: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

Bon marchés et souvent ils existent déjà Puissance théorique de ressources en calcul et mémoires impossible pour un super-ordinateur traditionnel  :

• HP laboratories (1500 WS) = 50 GO de RAM et quelques TO ( Téra octets) de disque. (1 TO = 1020 octets )

• UCBerkeleySodaHall (500 WS) = 64 GO de RAM et plus d’un TO de disque

Possibilités de bases de données en RAM distribuée :

Sdds : - Multiordinateurs - avantages

Page 12: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

RAM local RAM distant RAM distant Disque local réseau gigabit Ethernet

Temps d'accès 100 nsecs1 µsecs 100 µsecs 10 msecEn proportion 1 mn 10 mn 2 heures 8 jours

Sdds : - Multiordinateurs - avantages

Page 13: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

Les données sont identifiées par des clés (d1), OID pour les objets

Les données sont stockées sur des serveurs et sont accédées par des clients autonomes

Il n'y a pas de répertoire central d'accès• Image locale par client • Mécanisme de vérification et de redirection des requêtes• Mécanisme de mise à jour distribué des images des clients

Les mises à jour de la structure d'une SDDS ne sont pas envoyées aux clients de manière synchrone

Sdds : - Multiordinateurs – Axiomes généraux -

Page 14: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

Sdds : - Multiordinateurs – Contraintes -

Les IAM font converger l’image d'un client vers l'image réelle du fichier

L'ensemble des renvois ne se fait qu'en quelques messages. Contraintes de performance d'accès d'une SDDS

• Nombre de messages sur le réseau par opération(indépendante des paramètres du réseau)

• Convergence de vue d’un nouveau client et d'un client peu actif

Contraintes de scalabilité• Prendre en charge n’importe quelle quantité de données• Maintenir les performances quand le volume de données

stockées varie

Page 15: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

Sdds : - Multiordinateurs – Contraines -

Contraintes de distribution• Une grande quantité de données• Traitement parallèle et distribué

Contraintes de disponibilité• Assurer la continuité du fonctionnement 24 heures / 7

jours

Page 16: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

Sdds : - Multiordinateurs – typologie -

Basées sur le hachage :– LH*, DDH et EH*

Ordonnées :– RP*, CTH*, DRT, et Distributed B+-tree

Multidimensionnelles : – k-RP* , k-DRT et IH*

Haute-disponibilité : – LH*m, LH*s, LH*g, LH*RS , LH*SA

Page 17: Structures de données avancées :  SDDS (structures de données distribuées et scalables)

Arbre Hachage

Sdds : Variantes

ClassiquesSDDS

DRT, RP* CTH*1-dimensionnel

LH*, LH*LH

DDH, EH*

Structure de Données

d-dimensionnelIH**