algoritmer och datastructurer - sökträd, naiva och balancerade lösningar -hashtable

För utveckling av verksamhet, produkter och livskvalitet.

Algoritmer och datastructurer-Sökträd, naiva och balancerade lösningar

-HashTable-- Kapitel 19, 20.

Algoritmer och datastructurer-Sökträd, naiva och balancerade lösningar

-HashTable-- Kapitel 19, 20.


Speciella träd -Binära Sökträd

7

2

3

9

1151

Har ordnade element Mindre värde till vänsterHögre värde till höger


Är det ett sökträd?

7

2

3

9

1151

8


Implementation – noden

3

class Node <AnyType>{ AnyType element; Node left; Node right; Node( AnyType data) { element=data; left=right=null; }}


...och BinarySearchTree

public class BinarySearchTree <AnyType extends

Comparable<? super AnyType> > { Node <AnyType> root; public BinarySearchTree() { root=null; } -public void insert -public nbrOfNodes -public remove -public find , findMin, findMax}


Insert ()

7

2

3

9

1151

6


BinarySearchTree-insert (Comparable x)

public void insert ( Comparable x){ root = isert(x, root);}

public BinaryNode insert( Comparable x, BinaryNode t){ if(t==null) t= new BinaryNode(x); else if ( x.compareTo(t.element)<0) t.left=findPlaceAndLink(x, t.left); else if (x.compareTo(t.element)>0) t.right=findPlaceAndLink(x, t.right); else throw new DuplicateException(" No dublicates"); return t;

}


Binära Sökträd – metoden find()-mycket kort söktid


Binära Sökträd – metoden findMax()-mycket kort söktid


BinarySearchTree-find( )

public String find ( Comparable x){ BinaryNode n= findNode( x, root); if(n==null) return null; else return n.element;

}

public BinaryNode findNode( Compare x, BinaryNode t){ while( t!=null) { if(x.compareTo(t.element)<0) t=t.left; if(x.compareTo(t.element)>0) t=t.right; else return t ; // hittat!! }return null; // inte hittat !! }


Remove ()

7

2

3

9

1151

a) Om noden är löv


Remove ()

7

2

3

9

1151

b) Om noden har ett barn


Remove ()

7

2

3

9

1151

4

c) Om noden har två barn

3

Ersätt värdet i noden med den minsta värdet i i det högra delträdet och sedan ta bort den noden


Farliga specialfall! Trädet blir en länkad lista


Lösningen? Balancerade träd

• Hur ? Försök hålla djupet av trädet så lågt som möjligt.


Hur?

• Olika tekniker att balancera • AVL Träd• Red Black Träd• AA Träd


Balancerad Search Trees – AVL

12

8 16

14104

2 6

Ett träd är balancerad om höjdskillnaden mellan den vänstra delträdet och den högra delträdet är maximum 1.

HR=1HL=2

HL– HR = 2 – 1 = 1


Balanced Search Trees – AVL

12

8 16

14104

2 6

HL=1

HL– HR = 1 – 0 = 1

HR=0

Ett träd är balancerad om höjdskillnaden mellan den vänstra delträdet och den högra delträdet är maximum 1.


BST: AVL – Balanced?

128 16

104

2 6

1

14

insert


BST: AVL – Rotation höger

A

k1

B

C

k2

A B C

k1

k2


BST: AVL – Rotate right

10

12

16

14

k2

8

4

2 6

1

k1


BST: AVL – Rotation vänster

A

k1

B C

k2

A

B

C

k1

k2


AA – Träd

En ny nod skapas alltid som löv och har nivå 1.

En horizontal länk är en förbindelase med en nod med samma nivå. .

Två horisontala länkar är inte tilllåtna. Split!

5 6

5 76

4 1

5

6

7

2

1 1


Vänster länk är inte tilllåten

I det fallat gör – screw!

AA – Träd

4 5

4 5


AA – Träd : Operation split()

A

10 2015

B

15

2010

A B


AA – Träd : Operation skew()

A

10 15

B c

1510

A B c


Hash Tabeller?

• Varför en annan datastruktur?

• Konstant tid för både insert- och find- operationer


Hash?

Insert

”Daniel”=18

Find


Hashfunktioner!

• Hash functioner använder associerade “key” ( som kan vara data i sig ) .

• Hash funktionerna är olika för olika sorts data. • Integers• Images• StringsEtc…


Hashing integers?

• Tänk 16bit int => 0 – 65 535• Skapa int[] vec = new int[65536];• Add i => vec[i]++;• Sök value j => Is vec[j] > 0?• Ta bort value k => vec[k]--;• Men för en ... Java int : 32bit

• 4 billion items => impractical!


Exempel av hash funktion

DD aa nn ii ee ll

”Daniel”

68 97 110 105 101 108+ + + + + = 589


Men...

• Hur unik är den?• hashfunc(”Daniel”) → 589• hashfunc(”leinaD”) → 589

• Bättre lösning men….!• hashfunc(”TestValue”) → 129310392• Wrapp värdet till ett visst intervall

• Vilken? Arraystorleken…


En bättre hash funktion

• Ett bättre sätt att beräkna hash värdet • Om vi har en text sträng av längd n+1 och alla tecken har

index An, An-1,...,A0

• gör s = AnXn + An-1Xn-1 +...+ A0X0 =

• = ((An)X + An-1)X +...+ A0

• Använd hashValue = s % array.length


Och då......

• For example: ”Danne”

(((’D’)128 + ’a’)128 + ’n’)128 + ’n’)128 + ’e’ =

(((68)128 + 97)128 + 110)128 + 110)128 + 101 =

18 458 851 173

hashValue = 18 458 851 173 % array.length

om length = 7919 (prim nummer) =>

hashValue = 18 458 851 173 % 7919 =2690


Hur löser man kollision?

• Oavsett hur unika keys en hash- funktionen tar fram, kommer kollisioner alltid att inträffa.

• Terminology• Load factor

positions avaliable total#

positions used#LF


Lösningar

• Linear probing ( undersökning ??)• Quadratic probing• Double hashing• Separate chaining


Linear probing

• Sök fram till näst lediga platsen.

hashfunc( )

101818

X=18 X+1, X+2, X+3, X+4, X+5, ...


Linear probing

• Fenomen kallat: Primary clusters


Linear probing

• Bygger upp kluster• Påverkar exekveringstiden för insert () och find()!


Quadratic probing

• Försök undvika“primary clusters “• Snabbare än linjär probing• Kvadratisk inkrementation av undersöknings-avståndet

X=18 X+12, X+22, X+32, X+42, X+52, ...


Quadratic probing

• Garantera att hitta fria platser om de finns

12 = 122 = 432 = 9


Double hashing

• Använder ytterligare en till hash funktion för att hitta fri plats.

X = hash(obj);X2 = hash2(obj);

X=18, X2=7 X+1*X2, X+2*X2, X+3*X2, X+4*X2, ...

X=18, X2=7 18+1*7, 18+2*7, 17+3*7, 18+4*7, ...


Separate chaining

• Varje hash-position har en länkad lista. • Påverkar inte andra värdet, probing görs bara i listan. • Varje element i tabellen är en länkad lista.


Separate chaining

HH HH HH HH HH HH HH HH HHInsertInsertInsert


Jämförelse

• Linear probing• Enkel• Kan resultera i linjär söktid

• Quadratic probing• Kräver Load factor < 0.5 annars rehashing ??• Kräver primtal för array storleken

• Separate chaining• LF < 1• Ingen dubblering, länkade listor är dynamiska !• Kan leda till linjär sökning men i verklighetet ganska

kort • Double hash probing

• Eliminerar kluster


Hash tabeller i java

• I klassen java.util finns klassen HashMap<K,V> som implementerarinterfacet Map<K,V>.

public int hashCode() och public boolean equals(Object x)

så att man får identisk hashkod för objekt som är lika enligt metodenequals.Anm: För flera av Javas egna klasser är detta redan gjort. T exklassen String.


Använding av HashMap

• Antag vi vill vill sätta in Person-objekt i en hashtabell, med nyckel= personens namn:

class Person {String name; // namnlong pNbr; // personnummer

public Person(String n, long pnbr) {...}public boolean equals(Object rhs) {return name.equals(((Person) rhs).name);}// andra metoder i klassen Person}


Använding av HashMap

HashMap<String,Person> reg = new HashMap<String,Person>();Person p = new Person("Kalle", 1111111111);reg.put(p.name, p);...Person q = reg.get("Kalle");if (q != null) {...}Observera att vi här inte själva behöver omdefiniera hashCodeeftersom nycklarna är av typen String, och i denna klass är redanhashCode omdefinierad ( så att strängar för vilka equals ger trueockså får samma hashkod).


Användning av HashSet• Om vi vill sätta in Person-objekt i en samling av typen HashSet<Person> och

gör så här:

HashSet<Person> reg = new HashSet<Person>();Person p = new Person("Kalle", 1111111111);reg.add(p);...if (reg.contains(new Person("Kalle",0))System.out.println("found");elseSystem.out.println("not found");så blir utskriften ”not found”


• Anledningen är att när Kalle sätts in beräknas hashkoden förobjektet som p refererar till och placeringen i tabellen beror pådenna.• När vi sedan söker efter Kalle baseras sökningen på hashkodenav det objekt som är parameter till contains-metoden och dettaär ett annat objekt (med samma namn).• Sökningen utgår från den plats denna senare hashkod anger ochmed största sannolikhet är det i en helt annan del av tabellen änden där Kalle sattes in.

Användning av HashSet


hashCode-metod

• Vi kan se till att alla Person-objekt som har samma namn ocksåfår samma hashkod genom att omdefiniera metoden hashCode iklassen Person:

class Person {String name; // namnlong pNbr; // personnummer

public Person(String n, long pnbr) {...}public boolean equals(Object rhs) {som förut}public int hashCode() {return name.hashCode();}// övriga metoder i klassen Person}

algoritmer och datastructurer - sökträd, naiva och balancerade lösningar -hashtable

Documents