grundlagen der datenbanken - institute west · vorlesung „grundlagen der datenbanken“ am 17....

31
Institute for Web Science & Technologies – WeST Einführung und Überblick Dr. Thomas Gottron Wintersemester 2012/13 Grundlagen der Datenbanken

Upload: lamtruc

Post on 18-Sep-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Institute for Web Science & Technologies – WeST

Einführung und Überblick

Dr. Thomas Gottron

Wintersemester 2012/13

Grundlagen der Datenbanken

Page 2: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 2 Einführung

Frage an das Publikum...

Welche Erfahrungen gibt es mit Datenbanken?

Systeme?

Art der Verwendung?

Warum auf Datenbank zurückgegriffen?

Page 3: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 3 Einführung

Motivation

Warum Datenbanken?

Praxisrelevanz!

Überall Daten

Bankkonten

Krankenakten

Soziale Netzwerke

Anmeldungen zu Vorlesung, Übung, Prüfung

Buchbestand einer Bibliothek

Forschungsdaten (Umfragen, Messergebnisse, ...)

Straßenkarten

Einsatz von Informationssystemen

Page 4: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 4 Einführung 4

Page 5: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 5 Einführung

Kernfragen

Wie verwaltet man Daten?

Intuitiv?

Konsistent?

Effizient?

Sicher?

Nebenläufig?

→ Data & Knowledge Engineering

Page 6: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 6 Einführung

Data Engineering

Page 7: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 7 Einführung

Daten – Information – Wissen

Daten:

„201210171415“, …

Informationen:

„17. Oktober 2012, 14.15 Uhr“, ….

Wissen:

Vorlesung „Grundlagen der Datenbanken“

am 17. Oktober 2012, 14.15 Uhr in E-011

Kein Wissen ohne Daten

Übergang vom Daten- zum Wissensmanagement ist

nahtlos

Page 8: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 8 Einführung

Was ist Data Engineering?

Systematische Vorgehensweise zum “Umgang“ mit Daten

In der Forschung

Design

Entwicklung

Verwaltung,

Evaluation von Informationssystemen

In der Praxis

Planung

Analyse

Entwurf

Realisierung von Informationssystemen

Page 9: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 9 Einführung

Was gehört zum Data Engineering?

Statistik Algorithmen

Logik

Modellierung

Systembau

Prozesse

Data Engineering

& Management

Page 10: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 10 Einführung

Wo benötigt man Methoden des Data Engineering?

Desktop

Einloggen (single sign-on)

Textverarbeitung

Filesystem

Addressen

Handy, Smartcards, Auto

Eingebettete Datenbanken (z.B. für Smartcards)

Banken

Telekom

Besser wäre die Frage: Wo benötigt man keine Methoden des Data Engineering?!

Page 11: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 11 Einführung

Motivation für den Einsatz von Datenbank-Verwaltungssystemen

Typische Probleme:

• Redundanz und Inkonsistenz (Frau Meier wird Frau Meier-Ross)

• Beschränkte Zugriffsmöglichkeiten (alle 100 Eigenschaften von Frau Meier lesen, um ihre Telefonnummer zu sehen?)

• Probleme beim Mehrbenutzerbetrieb (zwei Überweisungen gleichzeitig?)

• Sicherheitsprobleme (jeder Mitarbeiter darf jedes Gehalt sehen?)

• hohe Entwicklungskosten für Anwendungsprogramme (k * 100 PersJahre)

• ......... ?

Page 12: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 12 Einführung

Handhabung der Daten (historisch)

Bänder

Dateisysteme

Satzorientierte Datenmodelle

Hierarchisch / Netzwerk

Relationale Datenmodelle

Postrelationale

Datenmodelle 90er

80er

70er

60er

50er

Schwerpunkt

der Vorlesung

Page 13: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 13 Einführung

Berühmte Systeme

Datenbanksysteme: Oracle DB, IBM DB2, Mysql, Postgres, Microsoft SQL Server, Microsoft Access, etc.

Suchsysteme: Google, Yahoo

Berühmte/interessante Anwendungen: SAP R3 Ihr Bankkonto Ihre Haftpflichtversicherung The GDB Human Genome Database wer-kennt-wen Flickr, YouTube Amazon …

Page 14: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 14 Einführung

DBMS

Page 15: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 15 Einführung

Datenbank vs DBMS

Datenbank

DBMS

(DB Management-

System)

Anwendung

Enthält

Datenbasis

Programme für Zugriff, Kontrolle,

Konsistenz, Modifikation

Geschäftslogik

Page 16: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 16 Einführung

Gegenstand der Vorlesung

Wie kann ich DBMS

einsetzen?

Data Engineering

Ordner A

Ordner B File 1 File 2

Page 17: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 17 Einführung

Gegenstand der Vorlesung (zum kleineren Teil)

Ordner A

Ordner B File 1 File 2

O r dner A

O r dner B File 1 File 2

O r dner A

O r dner B File 1 File 2

Page 18: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 18 Einführung

DBMS

Architekturübersicht eines DBMS

„Naive“

Nutzer

Fortgeschrittene

Nutzer

Anwendungs-

programmierer

Datenbank-

administratoren

Anwendung Interaktive

Anfrage Präcompiler

Verwaltungs-

werkzeug

DML Compiler DDL Compiler

Anfragebearbeitung

Datenbankmanager Schemaverwaltung

Mehrbenutzersynchronisation

Fehlerbehandlung

Dateiverwaltung

Logdateien Indizes Datenbasis Datenwörterbuch

Page 19: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 19 Einführung

Datenbankentwurf und

Abstraktion

Page 20: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 20 Einführung

Die Abstraktionsebenen des Datenbankentwurfs

Physische Ebene

Logische Ebene

Konzeptuelle Ebene Wie sieht die Welt aus ?

Welche Strukturen

werden von der

Anwendung

manipuliert?

Wie wird gespeichert ?

Page 21: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 21 Einführung

Die Abstraktionsebenen des Datenbankentwurfs

Element mit Matrikel-Nr

1234567 wird abgelegt auf

Block 19

1 Tabelle für Uni-Angehörige

und 1 Tabelle für Studenten,

mit Verbindungen

Studenten sind Personen

mit Matrikel-Nr

Physische Ebene

Logische Ebene

Konzeptuelle Ebene

Page 22: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 22 Einführung

Die Abstraktionsebenen eines DBMS

Datenunabhängigkeit:

• physische Unabhängigkeit

• logische Datenunabhängigkeit

Sicht 1 (Verwaltung) Sicht k (Bibliothek) ...

Physische Ebene

Logische Ebene

Page 23: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 23 Einführung

Datenmodellierung

Ausschnitt der

realen Welt

Konzeptuelles Schema

(ER-Modell)

Relationales

Schema

Objektorientiertes

Schema

Netzwerk

Schema

Intellektuelle Modellierung

Semi-automatische Transformation

Page 24: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 24 Einführung

Logische Datenmodelle

Netzwerkmodell

Hierarchisches Datenmodell

Relationales Datenmodell

Objektorientiertes Datenmodell

Deduktives Datenmodell

24

Page 25: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 25 Einführung

Modellierung einer Beispielanwendung

Studenten

Vorlesungen

Dozenten

Welche Eigenschaften?

Welche Beziehungen?

Welche weiteren wichtigen Objekte?

Page 26: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 26 Einführung

Modellierung einer Beispielanwendung

reale Welt: Hochschule Studenten, Vorlesungen,

Professoren...

Konzeptuelle Modellierung

Studenten Professoren

lesen

Vorlesungen

MatrNr

Name

PersNr

Name

VorlNr

Titel

hören

SWS

Semester

Page 27: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 27 Einführung

Das relationale Datenmodell

Studenten

MatrNr Name

26120

25403

...

Fichte

Jonas

...

hören

MatrNr VorlNr

25403

26120

...

5022

5001

...

Vorlesungen

Nr Titel

5001

5022

...

Grundzüge

Glaube und Wissen

...

Select Name

From Studenten, hören, Vorlesungen

Where Studenten.MatrNr = hören.MatrNr and

hören.VorlNr = Vorlesungen.Nr and

Vorlesungen.Titel = `Grundzüge´;

update Vorlesungen

set Titel = `Grundzüge der Logik´ where Nr = 5001;

Page 28: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 28 Einführung

DB-Anfragen: Flexibilität

Eine Bedingung spezifiziert die entsprechende Teilmenge der

Treffer (Tupeln, Dokumente, …) in der Datenbank.

Boolsche Operationen (AND; OR; NOT) werden verwendet, um

Bedingungen / Treffermengen zu kombinieren.

Wieviele unterschiedliche Teilmengen der Datensammlung lassen

sich mit 3 unterschiedlichen Bedingungen spezifizieren?

a) 7

b) 8

c) 16

d) 256

Kombinationsmöglichkeiten

für 8 Teilmengen:

(0 0 0 0 0 0 0 0)

bis (1 1 1 1 1 1 1 1)

28 = 256

1 2 3

4 5

6

7 8

Page 29: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 29 Einführung

Lernziele

Die Studierenden verstehen die Arbeitsweise relationaler

Datenbankverwaltungssysteme.

Sie können den Einsatz eines solchen Systems

konzipieren und realisieren.

Sie können aufgrund ihres Wissens zur Arbeitsweise

relationaler Datenbanksysteme mögliche auftretende

Engpässe im Verhalten eines

Datenbankmanagementsystems analysieren und

vermeiden oder umgehen.

Sie sind in der Lage Methoden aus dem

Datenmanagement in ihre eigenen Systeme zu

übernehmen und diese Methoden sowie das System

Relationale Datenbankverwaltung in der Praxis

einzusetzen.

Page 30: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 30 Einführung

Zusammenfassung

Informationssysteme haben hohe Praxisrelevanz

Helfen typische Problemstellungen zu bewältigen

Datenbank DBMS

Vorteile durch Abstraktion in Modellierung

SQL als „Standard“-Sprache

Page 31: Grundlagen der Datenbanken - Institute WeST · Vorlesung „Grundlagen der Datenbanken“ am 17. Oktober 2012, 14.15 Uhr in E-011 Kein Wissen ohne Daten ... The GDB Human Genome Database

Thomas Gottron GLDB 2012/13 31 Einführung

Fragen ?

[email protected]

http://west.uni-koblenz.de/teaching/ws1213/datenbanken