einführung - ansätze - algorithmus seminar semantisches ...klusch/seminar-sws06/ovidiuvela... ·...
TRANSCRIPT
![Page 1: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/1.jpg)
1
Database Schema Matching
Einführung - Ansätze - Algorithmus
Seminar : Semantisches Web und Agenten –WS 2006/2007
Ovidiu Vela
![Page 2: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/2.jpg)
2
Schema Matching - Definition
Identifikation von inhaltlichen Zusammenhängenzwischen verschiedenen Schemas
![Page 3: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/3.jpg)
3
Schema Matching - Beispiel
S1
Kunde Kunde_NrKunde_NameKunde_AdresseKunde_Tel
S2
CustomerCust_ID Cust_FName Cust_LNameCust_Contact
![Page 4: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/4.jpg)
4
Schema Matching - Motivation
Große Schemasviele Tabellen & AttributeBildschirm nicht lang genug
Unübersichtliche SchemasTiefe SchachtelungenFremdschlüsselBildschirm nicht breit genug
Fremde SchemasUnbekannte SynonymeUnbekannte Homonyme
Fremdsprachliche SchemasKryptische Schemas
Abkürzungen
![Page 5: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/5.jpg)
5
Schema Matching - Nutzung
• Schema Integration• Data Warehouses• E–Commerce• Semantic Query Processing
![Page 6: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/6.jpg)
6
Schema Integration
Ziel:Menge von Schemas in ein einziges Schema überführen
Problem:Unabhängig entwickelte Schemas
-unterschiedliche Strukturen-unterschiedliche Terminologie
Lösung:Identifizierung und Charakterisierung der
Strukturbeziehungen
![Page 7: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/7.jpg)
7
Data Warehouses
Ziel:Daten aus verschiedenen Datenbanken in eineumfangreiche generelle Datenbank überführen
Problem:Umwandlung der Daten aus Quelldatenbank in dem
Format für LagerdatenbankLösung;
Finden der gemeinsamen Elementen der Quelldatenbankund Lagerdatenbank
![Page 8: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/8.jpg)
8
E-Commerce
Ziel:Das Ermöglichen des Informationsaustausches
zwischen SystemenProblem:
Übersetzung verschiedenen Nachrichten- unterschiedliche Namen- unterschiedliche Datentypen- unterschiedliche Strukturen
Lösung:Matching zwischen Nachrichtenschemas
![Page 9: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/9.jpg)
9
Semantic Query Processing
Ziel:Benutzer soll mit dem System in natürlicher
Sprache kommunizierenProblem:
Die Benutzerkonzepte sind verschieden von denen vom System benutzte Konzepte
Lösung:Abbildung zwischen den Elementen des Systems
und die Konzepten die in der Frage vorkommen
![Page 10: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/10.jpg)
10
Schema Matching -Algorithmus
EINGABEzwei Schemata mit Attributmengen A und B
IDEEBilde Kreuzprodukt aller Attribute aus A und BFür jedes Paar berechne Ähnlichkeit
Z.B. bzgl. AttributnamenZ.B. bzgl. gespeicherten Daten
AUSGABEPaare mit Ähnlichkeit > Schwellwert (Mapping)
![Page 11: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/11.jpg)
11
Schema Matching - Ausgabe
Abbildung – Menge von AbbildungselementenAbbildungselement - Paar von Elementen aus zwei Schemas
(a, b) von Typ 1:1, 1:n, n:1, n:mAbbildungsausdruck
Abbildungsausdruck – Art der Relation zwischen Elementen Gerichtet oder ungerichtetEinfache Relation (=, >, ...)Funktionen (Konkatenation, Addition, ...)ER-Relationen (is-a, part-of, ...)Mengenorientiert (Durschnitt, ...)
![Page 12: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/12.jpg)
12
Ausgabe - BeispielS2
CustID CustFName CustLNameCust Contact
S1KundeNrKundeNameKundeAdrKundeTel
({S1.KundeNr}, {S2.CustId}) S1.KundeNr = S2.CustId
(S1.KundeName, {S2.CustFName, S2.CustLName})S1.KundeName = Concatenate(S2.CustFName, S2.CustLName)
({S1.KundeAdr, S1.KundeTel}, S2.CustContact)Concatenate(S1.KundeAdr, S1.KundeTel) = S2.CustContact
![Page 13: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/13.jpg)
Schema Matching Ansätze
Individuelle Ansätze Kombinierte Ansätze
Label-basiert Instanz-basiert Hybrid Zusammengesetzt
Elementebene Strukturebene Elementebene Manuell Automatisch
Linguistisch-basiert
Constraint-basiert
Linguistisch-basiert
Constraint-basiert
Constraint-basiert
![Page 14: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/14.jpg)
14
Schema Matching - Tools
SemInt (Northwestern Univ.)ER, Label & Instanz basiert, [1,1], Hybrid
LSD (Univ. of Washington)XML, Label & Instanz basiert, [1,1], Zusammengesetzt
SKAT (Standford Univ.)XML, IDL, [1,1][n,1], Label basiert, Hybrid
TransScm (Tel Aviv Univ.)SGML, OO, [1,1], Label basiert, Hybrid
DIKE (Univ. Of Reggio Calabria, Univ of Calabria)ER, [1,1], Label basiert, Hybrid
ARTEMIS (Univ. Of Milano, Univ. of Brescia)ER, OO, [1,1], Label basiert, Hybrid
Cupid (Microsoft Research)XML, ER , [1,1][n,1], Label basiert, Hybrid
![Page 15: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/15.jpg)
15
Similarity Flooding
Entwickelt von Sergey Melnik, Hector Garcia-Molina (Stanford), Erhard Rahm (Leipzig)Matching Algorithmus, um Ähnlichkeit zwischen Knoten zweier gerichteten und beschrifteten Graphen zu bestimmenIterative Berechnung eines FixpointAndwendbar auf diverse Datenstrukturen (Modelle)
![Page 16: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/16.jpg)
16
Similarity Flooding
Die IdeeUmwandlung der Modelle in gerichtete GraphenBenutze diese Graphen für eine iterative Fixpoint Berechnung der Ähnlichkeit
Zwei Knoten (aus zwei Graphen) sind ähnlich wenn ihre benachbarte Knoten ähnlich sind(Die Ähnlichkeit zweier Knoten flutet die Ähnlichkeit der benachbarten Knoten)
![Page 17: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/17.jpg)
17
Matching - Algorithmus
1. G1 = SQL2Graph(S1);G2 = SQL2Graph(S2);
2. initialMap = StringMatch(G1, G2);3. product = SFJoin(G1, G2, initialMap);4. result = SelectThreshold(product);
CREATE TABLE Personnel (Pno int,Pname string,Dept string,Born date,UNIQUE pkey(Pno) );
S1
CREATE TABLE Employee (EmpNo int PRIMARY KEY,EmpName varchar(50),DeptNo int REFERENCES
Department,Salary dec(15,2),Birthdate date ) ;
CREATE TABLE Department (DeptNo int PRIMARY KEY,DeptName varchar(70) );
S2
![Page 18: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/18.jpg)
18
Matching - AlgorithmusSchritt 1 – Umwandlung der Schemas in Graphen
G1 = SQL2Graph(S1);
CREATE TABLE Personnel (
Pno int,Pname string,Dept string,Born date,
UNIQUE pkey(Pno) );
CREATE TABLE Personnel (
Pno int,Pname string,Dept string,Born date,
UNIQUE pkey(Pno) );
![Page 19: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/19.jpg)
19
Matching - Algorithmus
Schritt 2 – Grobes Matching Namen-basiert
initialMap=StringMatch(G1, G2);
Departmentint0.06
DepartmentDept0.11
BirthDatedate0.22
EmpNamePname0.26
DeptNamePname0.26
PrimaryKeyUniqueKey0.50
DeptNameDept0.66
DeptNoDept0.66
TypeColumnColumn0.66
ColumnColumn1.0
Node in G2Node in G1Similarity
![Page 20: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/20.jpg)
20
Matching - Algorithmus
Schritt 3 – Similarity Flooding(SFJoin)product = SFJoin(G1, G2, initialMap);
Die Anfangswerte von initialMapIteration – in jedem Schritt hat die Ähnlichkeit zweier Elemente eine Auswirkung auf die Ähnlichkeit ihrer NachbarnSolange iterieren bis die Ähnlichkeitswerte sich stabilisieren – der Fixpoint ist erreicht
![Page 21: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/21.jpg)
21
Matching - Algorithmus
Schritt 4 – Filterungresult = SelectThreshold(product);
Similarity Node in G1 Node in G21.0 Column Column0.81 [Table:Personnel] [Table:Employee]0.66 ColumnType ColumnType0.44 [ColumnType:int] [ColumnType:int]0.43 Table Table0.35 [ColumnType:date] [ColumnType:date]0.29 [UniqueKey:pkey] [PrimaryKey: on EmpNo]0.28 [Col:Personnel/Dept] [Col:Departament/DeptName]0.25 [Col:Personnel/Pno] [Col:Employee/EmpNo]0.19 UniqueKey PrimaryKey0.18 [Col:Personnel/Pname] [Col:Employee/EmpName]0.17 [Col:Personnel7Born] [Col:Employee/Birthdate]
![Page 22: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/22.jpg)
22
Similarity Flooding -Algorithmendetails
product = SFJoin(G1, G2, initialMap);Paarweise Konnektivitätsgraph(PCG)( ) ( )( ) ( ) ( ) ( ) ByeyandAxexBAPCGyxeyx ∈′∈′⇔∈′′ ,,,,,,,,,
a2a1
a
l1 l1
l2
b2b1
b
l1 l2
l2
a1,b1 a2,b1
a1,b2
a,b
a2,b2
a1,b
l2l1 l1
l2
A B
![Page 23: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/23.jpg)
23
Similarity Flooding -Algorithmendetails
Induzierte PropagationsgraphEinführung der Kanten in GegenrichtungPropagierungskoeffizient für jede Kante
a1,b1 a2,b1
a1,b2
a,b
a2,b2
a1,b
l2l1 l1
l2a1,b1 a2,b1
a1,b2
a,b
a2,b2
a1,b
1.00.5
1.0
1.00.5
1.0
1.0
1.0
![Page 24: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/24.jpg)
24
Similarity Flooding -Algorithmendetails
Fixpoint BerechnungÄhnlichkeitsfunktion σ(x,y)≥0 für alle x∈A, b∈BIterative Berechnung der σ Funktion
( ) ( ) ( ) ( )( )( ) ( )
( ) ( ) ( )( )( ) ( )
∑
∑
∈∈
∈∈
⋅+
⋅=
BbpyAapxvvvv
i
BypbAxpauuuu
ii +1
vv
uu
yxbaba
yxbabayx
,,,,,
,,,,,
,,,,
,,,,,
ωσ
ωσσ ( )i yx ,σ +
0 σ = Ähnlichkeitwerten von Initial MapingNormalisierung der Werte durch Teilung mit der maximale σ
![Page 25: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/25.jpg)
25
Similarity Flooding -Algorithmendetails
Fixpoint Berechnungnach 5 Iterationen
a,b
a2,b2
a1,b
a1,b1
a1,b2
a2,b1
0.33
0.33
0.39
0.69
0.91
1.0
a1,b1 a2,b1
a1,b2
a,b
a2,b2
a1,b
1.00.5
1.0
1.00.5
1.0
1.0
1.0
![Page 26: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/26.jpg)
26
Similarity Flooding -Algorithmendetails
Fixpoint BerechnungIteration bis euklidische Distanz des residual Vektors ∆( )nσ, n-1σ
kleiner als ein εMehrere Formeln für Fixpoint Berechnung
( )( )
( )( )
( )( )
( )( )iii
ii
ii
iii
normalize
normalize
normalize
normalize
σσϕσσσ
σσϕσ
σϕσσ
σϕσσ
+++=
+=
+=
+=
+
+
+
+
001
01
01
1
:C
:B
:A
:Basic
![Page 27: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/27.jpg)
27
Similarity Flooding - Filterung
Für jedes Element eine Menge von MatchkandidatenVon n Matchingpaare 2 AbbildungsuntermengenAuswahlstrategie einer Untermenge 1. Model-spezifische Constraints
Typ ConstraintsKardinalität
2. Auswahlverfahren entwickelt für bipartite GraphenStable marriageMaximal matcing
3. Anwendung der Auswahlverfahren auf Modellklassen und Auswertung der Ergebnisse der Auswahlverfahren
n
![Page 28: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/28.jpg)
28
Similarity Flooding - Filterung
Mapping = ungerichteter gewichteter bipartiter GraphAnsätze aus dem Gebiet der bipartiten Graphen
Stable marriage ò(a,b) und (a‘,b‘) so dass σ (a,b‘) > σ (a,b) und σ (b‘,a) > σ( b‘,a‘)
Assignment Problem3 σ(a,b) maximal
Perfectionist egalitarian polygamy ò(a,b) und a‘ b‘ so dass σ (a,b) < σ (a,b‘) oder σ (b,a) < σ (b,a‘)Maximum matching, complet matching, etc.
![Page 29: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/29.jpg)
29
Similarity Flooding - Filterung
a1
a2 b2
b11.0
0.81 0.54
0.27
Mapping M
4 Paare => 16 Mögliche Untermengen
M1 = {(a1,b1),(a2,b2)} [1,1]-[1,1]Kardinalitätconstraint M2 = {(a1,b2),(a2,b1)}
Auswahlverfahren Σ σ = 1.27 , Σ σ = 1.35M1 M2
M1 stable marriage
![Page 30: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/30.jpg)
30
Similarity Flooding - Filterung
SelectThreshold OperatorBerechnung der relativen Ähnlichkeiten
a1
a2 b2
b11.0
0.81 0.54
0.33
1.0
1.00.5
1.0
en Relative Ähnlichkeiten
σ‘a1
a2 b2
b11.0
0.81 0.54
0.27
Absolute Ähnlichkeitσ‘(a) = max(σ(a,b))
Bb∈
σ(a,b)σ‘(a,b) = σ‘(a)
Auswahl der Paare mit relativer Ähnlichkeit > Schwelle t Auswahl einer Menge unter stable mariage Voraussetzungen
![Page 31: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/31.jpg)
31
Similarity Flooding - Evaluierung
9 relativ einfache AbbildungsproblemeAbbildung von XML Schemas (1,2,3)Abbildung von XML Schemas mit Instanzen (4,5,6)Abbildung von relationale Schemas (7,8,9)
(Propagationsgraphen zwischen 128 und 1222 Knoten)7 BenutzerFixpoint Formel C - normalize(σ + σ + φ(σ + σ ))SelectThreshold Operator mit t = 1
i0i0
![Page 32: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/32.jpg)
32
Similarity Flooding - Evaluierung
-20
0
20
40
60
80
100
1 2 3 4 5 6 7 8 9
User 1 User 2 User 3 User 4 User 5 User 6 User 7 Average
![Page 33: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/33.jpg)
33
Similarity Flooding - Evaluierung
FilterungThresold - SelectThreshold Operator t=1, [0,n]-[0,n]Exact - Threshold mit [0,1]-[0,1]Best – Assignment Problem [0,1]-[0,1]Left – Assignment Problem [0,1]-[1,1]Right – Assignment Problem [1,1]-[0,1]Outer – [1,n]-[1,n]
Fixpoint Formel( )( )
( )( )
( )( )
( )( )iii
ii
ii
iii
normalize
normalize
normalize
normalize
σσϕσσσ
σσϕσ
σϕσσ
σϕσσ
+++=
+=
+=
+=
+
+
+
+
001
01
01
1
:C
:B
:A
:Basic
![Page 34: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/34.jpg)
34
Similarity Flooding - Evaluierung
-100
-80
-60
-40
-20
0
20
40
60
Threshold Exact Best Right Left Outer
A
B
C
Basic
![Page 35: Einführung - Ansätze - Algorithmus Seminar Semantisches ...klusch/seminar-SWS06/OvidiuVela... · 1 Database Schema Matching Einführung - Ansätze - Algorithmus Seminar: Semantisches](https://reader033.vdocuments.mx/reader033/viewer/2022060321/5f0d45157e708231d43982f4/html5/thumbnails/35.jpg)
35
Similarity Flooding – Pro & Kontra
ProInnovative Methode (2001-2002)Für jede Schematyp anwendbarKeine Trainingsphase notwendigFlexibel was Filterung betrifft
KontraSchlechte Grundlage für PropagierungFehler sind auch propagiertFlooding Algorithmen sind üblicherweise langsamBenutzt keine InstanzenKann nicht komplexe Relationen zwischen Elemente erkennen InitialMatch hat sehr grossen Einfluss auf das Ergebniss, was wieder zu der Frage führt: Wie kann man ein gutes Matching entwerfen?