kemometri ders notları

Upload: mesut-genisoglu

Post on 10-Feb-2018

430 views

Category:

Documents


10 download

TRANSCRIPT

  • 7/22/2019 kemometri ders notlar

    1/41

    Prof.Dr.Durmu ZDEMR

    YTE Fen FakltesiKimya Blm

    zmir

    KEMOMETR DERS NOTLARI

    BLM I

    DENEYSEL TASARIM VE OPTMZASYON

    KONULAR

    1. Deneysel Tasarmn nemi2. Tarama Tasarmlar (Screening Designs)

    2.1.Ful Faktriyel Tasarm

    2.2. Fraksiyonel faktriyel tasarm

    2.3. Plackett-Burman tasarm

    3. Optimizasyon

    3.1. Merkezi Kompozit Tasarm

    1. DENEYSEL TASARIMIN NEM

    Deneysel tasarmn nemi drt maddede aklanabilir.

    Tarama (Screening): Bu tasarmlar deneysel almalarda sonucu etkileyen nemlifaktrleri belirlemek iin kullanlr. Bir kimyasal reaksiyonun verimini etkileyen faktrler,kullanlan reaktif konsantrasyonu, katalizr konsantrasyonu, scaklk, pH, reaksiyon sresi,kartrma hz, vb. 10 faktr etkiledii dikkate alndnda bu faktrlerden hangilerinemlidir, hangileri elimine edilebilir ve hangileri ayrntl incelenmelidir? Bu sorularncevaplar faktriyel ve Plackett-Burman tasarmlar ile verilebilir.

    Optimizasyon: Tarama tasarmlar ile bulunan nemli faktrlerin optimum deerlerioptimize edilerek reaksiyonun verimi ve kromatografik ayrma iyiletirilebilir. En yaygn

  • 7/22/2019 kemometri ders notlar

    2/41

  • 7/22/2019 kemometri ders notlar

    3/41

    ekil 2. pH 3.4te sabit tutularak bulunan optimum konsantrasyon.

    Daha sonra any deneysel alma istatistiksel deneysel tasarm ynetemi ilegereekletirilmi ve elde edilen sonular ekil 3te verilmitir.

    ekil 3. pH ve katalizr konsantrasyonuna bal olarak reaksiyon verimindekideiimi.

    statistiksel deneysel tasarm metodu kullanlarak elde edilen optimum artlar pH 4.4 vekonsantrasyon 1.0 mM olarak bulunmutur. Bu noktada klasik yaklamla bulunan optimumartlar ile istatistiksel deneysel tasarm metodu ile bulunan sonulardan olduka farkl olduu

    grlmektedir. Bu farkn nedeni pH ve konsantarsyon arasndaki etkilemedir. Bu nedenleistatistiksel deneysel tasarm kullanlarak bu etkileimler gz nnde bulundurulmal ve

  • 7/22/2019 kemometri ders notlar

    4/41

    deneysel tasarm yntemine gre optimum deerler bulunmaldr.leriki blmde benzer birrnek uygulamal ekilde ayrntl olarak tekarar incelenecektir.

    2. TARAMA TASARIMLARI

    2.1 Tam Faktriyel Tasarm

    Tam faktriyel tasarm sonu zerine etki eden faktrlerin hangileri ve ne kadar etkiliolduunu anlamada kullanlan iki seviyeli bir tarama tasarmdr. rnein, bir kimyasalreaksiyon pH ve scakla bal olarak deiiyorsa, iki seviyeli iki faktrl bir deneytasarlanabilir. Deney says 2kforml ile hesaplanr. Burada 2, seviye says (-1 ve +1 olarakkodlanr), k ise faktr saysdr (burada 2 faktr var). Faktriyel tasarmda, 2 faktr iin deneysays 4 (22), 3 faktr iin deney says 8dir (23). Tam faktriyel tasarm tablosu hazrlamakiin, her bir faktr iin yksek ve dk seviyeler belirlenir. rnein scaklk 30oC ve 60oC,

    pH 4 ve 6. Yksek (+1) ve dk (-1) seviyelere gre tasarm tablosu oluturulur (izelge1).

    izelge1. ki seviyeli iki faktrl tam faktriyel tasarm

    Deney x1 x2

    1 -1 -1

    2 +1 -1

    3 -1 +1

    4 +1 +1

    izelge 2 ve 3te srasyla 3 ve 4 faktrl iki seviyeli tam faktriyel tasarmlarn tablolarverilmitir

    izelge2. ki seviyeli faktrl tam faktriyel tasarm

    Deney x1 x2 x3

    1 -1 -1 -1

    2 +1 -1 -1

    3 -1 +1 -1

    4 +1 +1 -1

    5 -1 -1 +1

    6 +1 -1 +1

    7 -1 +1 +1

    8 +1 +1 +1

    izelge3. ki seviyeli drt faktrl tam faktriyel tasarm

  • 7/22/2019 kemometri ders notlar

    5/41

    Deney x1 x2 x3 x41 -1 -1 -1 -12 +1 -1 -1 -13 -1 +1 -1 -14 +1 +1 -1 -1

    5 -1 -1 +1 -16 +1 -1 +1 -17 -1 +1 +1 -18 +1 +1 +1 -19 -1 -1 -1 +110 +1 -1 -1 +111 -1 +1 -1 +112 +1 +1 -1 +113 -1 -1 +1 +114 +1 -1 +1 +115 -1 +1 +1 +116 +1 +1 +1 +1

    Deneysel tasarm tablosu hazrlandktan sonra kodlanm deerler yerine faktrleringerek deerleri yerletirilerek deneysel alma gerekletirilir. rnein, faktrl ikiseviyeli bir sistemde faktrlerin minimum ve maksimum seviyeleri izelge 4te verilmitir.

    izelge 4. faktr iki seviyeli bir sistemde faktrlerin minimum ve maksimum aralklar

    Faktrler (-1) seviye (+1) seviye

    Katalizr konsantrasyonu (%) 0.1 0.3Reaksiyon scakl ( C) 60 80Reaksiyon sresi (dk) 20 40

    izelge 5, iki seviye zerinden gerekleitirilen ve katalizr konsantrasyonu (x1),reaksiyon scakl (x2) ve reaksiyon sresi (x3) faktrlerinden oluan 8 deneye ait her bir

    faktrn gerek skalasndaki deerleri ve bu sistemde elde edilen sonular (y deerleri)gstermektedir.

    izelge 5. Deneysel sonular da ieren faktrl tasarm

    Deney x1 x2 x3 y

    1 0.1 60 20 73

    2 0.3 60 20 71

    3 0.1 80 20 79

    4 0.3 80 20 82

    5 0.1 60 40 78

    6 0.3 60 40 89

  • 7/22/2019 kemometri ders notlar

    6/41

  • 7/22/2019 kemometri ders notlar

    7/41

  • 7/22/2019 kemometri ders notlar

    8/41

    izelge 8. ki faktrl seviyeli deneysel tasarmda faktrlerin minimum, orta vemaksimum seviyeleri.

    Faktr Minimum Orta Maksimum

    Kodlanm -1 0 +1

    pH 3 6 9

    KatalizrKonsantrasyonu, M

    1 2 3

    izelge 8de verilen faktrlerin seviyeleri deneysel tasarm matrisinin oluturulmasndagenellikle kodlanm olarak verilir. Bunun nedeni her bir faktrn genellikle olduka farkl

    skalalara sahip olmasdr ve tasarmnn istatistiksel analizinin bu skala farkndan etkilenmesitercih edilmez. izelge 9de gerekletirilen deney elde edilen verimlerle birlikte verilmitir.

    izelge 9. ki faktrl 3 seviyeli tam faktriyel deneysel tasarm ve elde edilen verimler.

    No pH, x1 Katalizr Konsantrasyonu, M, x2 Verimi, y

    1 3 1 41

    2 3 2 59

    3 3 3 60

    4 6 1 61

    5 6 2 76

    6 6 3 71

    7 9 1 61

    8 9 2 69

    9 9 3 59

    izelge 9de gerekletirilen 9 deneyin verimleri incelendiinde en yksek verimin pH 6 ve 2M katalizr konsantrasyonunda olduu grlmektedir. Ancak szkonusu reaksiyonda enuygun artlarn ne olaca ve ve reaksiyon verimine etki ettii dnlen bu iki faktrnistatistiksel olarak nasl bir katk yaptn grebilmek iin deneysel verim deerleri ile bufaktrler aras ilikiyi veren bir denklem kurarak inceleyebiliriz. Bu noktada, her iki faktr 3farkl seviyede alld iin bu faktrlerin dorusal etkilerinin yannda ikinci derecedenetkileri ile birbirleri ile olan etkileimlerininde incelenmesinde fayda vardr. Eitlik 3te ikifaktrl bir sistemde ikincidereceden model denklemi verilmitir.

    y = b0+ b1x1 + b2x2 + b11x1^2 + b22x2^2 + b12x1x2 + e (3)

  • 7/22/2019 kemometri ders notlar

    9/41

    Eitlik 3 de b0, her bir faktr kodlanm olarak orta seviyede (sfr alndnda) tutulduunda

    denklemin alaca sabit deeri gsterirken, b1 ve b2 katsaylar her bir faktrn dorusal

    katksn gsterir. te yandan b11 ve b22 deerleri ikinci dereceden (dorusal olmayan)

    katklar gsterirken, b12 degeride her iki faktrn etkileimlerini temsil etmektedir. Son

    olarak, e terimide modellenemyen artklar gstermektedir. izelge 10, eitlik 3de verilenmodel denklemine gre hazrlanm deneysel tasarm matrisini oluturmaktadr.

    izelge 10. ki faktrl seviyeli tam faktriyel bir sistemde kullanlan deneysel tasarmmatrisi.

    No b0 x1 x2 x1^2 x2^2 x1x2 y

    1 1 -1 -1 1 1 1 41

    2 1 -1 0 1 0 0 59

    3 1 -1 1 1 1 -1 604 1 0 -1 0 1 0 61

    5 1 0 0 0 0 0 76

    6 1 0 1 0 1 0 71

    7 1 1 -1 1 1 -1 61

    8 1 1 0 1 0 0 69

    9 1 1 1 1 1 1 59

    izelge 10da verilen tasarm matrisinin ilk stunu deneylerin srasn gsterirken son stn

    ise elde edilen deneysel verimleri gstermektedir. Arada kalan 6 adet stn ise asl tasarmmatrisini oluturmaktadr. Bylece matris notasyonunda eitlik 3 yeniden dzenlenirse, eitlik4te verilen model denklemi elde edilir.

    y = D xb + e (4)

    Eitlik 4den de grlecei gibi koyu renk kk harf vektr temsil ederken koyu renkli

    byk harf matrisi temsil etmektedir. Bu denklemde y ve D bilinmekte olup bilinmeyenkatsaylar vektrnn hesab enkk kareler metoduna gre matris notasyonunda eitlik 5teverildii gibi hesaplanr.

    =(DxD) 1xDxy(5)

    Eitlik 5 kullanlarak elde edilen katsaylar eitlik 4de yerine konarak tahmin edilen

    deerleri ve daha sonrada deneysel y deerleri ile hesaplanan deerieri arasndaki

    farklardan artklar (eitlik 6) hesaplanabilir.

  • 7/22/2019 kemometri ders notlar

    10/41

    e = y - (6)

    Bu noktaya kadar verilen bu reaksiyon verimine ilikin rnein regresyon, ANOVA ve t-testianalizleri aada verilen MS Excel sayfalarnda adm adm verilmitir. ncelikle Data

    sekmesinden Data Analysis seenei seilerek Regression seilmelidir (Resim 1).

    Resim 1. Regresyon analizi iin verilerin regresyon analizi basama.

    Aada verilen (Resim 2) resimde grld gibi ilgili alanlar seildikten sonra regresyonanalizi gereekletirilir.

  • 7/22/2019 kemometri ders notlar

    11/41

    Resim 2. Regresyon analizinin gereekletirilmesi.

    Regresyon analizinin sonular aagda (izelge 11, 12, 13, 14 ve 15) verilmitir. ncelikleizelge 11de seilen ikinci dereceden model denklemi kullanlarak elde edilen modelindeneysel sonular ne kadar iyi tahmin ettiini gsteren R2 deerinini grmekteyiz. Buradaelde edilen R

    2 deeri 0.998 gibi olduka iyi bir sonu olduundan seilen model denklemininolduka baarl olduunu grmekteyiz.

    izelge 11. Regresyon analizinin zeti.

    zet kts

    Regresyon statisitii

    okluR 0.999034

    R2 0.998068

    ayarlanmR2 0.994849

    Standart hata 0.713624

    Gzlem says 9

    izelge 12de regresyon analizinin ANOVA sonularn grmekteyiz. Burada elde edilen F-deerinin 310 gibi byk bir rakam olams faktr seviyelerinin deitirilmesi ile elde edilendeneysel verim sonularnn %95 gven snrnda istatistiksel olarak anlaml olduunusyleyebiliriz.

    izelge 12. Regresyon analizinin ANOVA sonular

    ANOVA

    df SS MS F P-deeri

    Regresyon 5 789.3611 157.8722 310.0036 0.000287767Artklar 3 1.527778 0.509259

  • 7/22/2019 kemometri ders notlar

    12/41

    Toplam 8 790.8889

    izelge 13, ngrlen ikinci dereceden model denklemi (eitlik 3) katsaylar ve bukatsaylarn standart hatalar, t-deerleri, P-deerleri ve %95 alt ve st gven aral (GA)verilmektedir.

    izelge 13. ngrlen ikinci dereceden model denklemi katsaylar ve bu katsaylarnstandart istatistiksel analiz sonular.

    Katsaylar Standart Hata t-deeri P-deeri %95 alt GA %95 st GA

    b0 75.4444 0.5319 141.8385 0.0000 73.7517 77.1372

    b1 4.8333 0.2913 16.5902 0.0005 3.9062 5.7605

    b2 4.5000 0.2913 15.4461 0.0006 3.5728 5.4272

    b11 -11.1667 0.5046 -22.1294 0.0002 -12.7726 -9.5608

    b22 -9.1667 0.5046 -18.1659 0.0004 -10.7726 -7.5608

    b12 -5.2500 0.3568 -14.7136 0.0007 -6.3855 -4.1145

    izelge 13den grld gibi her iki faktrn dorusal (b1ve b2) etkilerinin P-deerleri 0.05(=0.05) ten kk olduu iin szkonusu terimler %95 gnen snrnda istatistiksel olarakanlaml terimleridir ve model sdenkleminde bulumas gerekir. Ayrca szkonusu iki faktrnikinci dereceden etkileri (b11ve b22) ile bu faktrlerin birbirleri ile olan etkileimi (b12) %95gven snrnda istatisitiksel olarak nemlidir. Bylelikle reaksiyon veriminin modeldenklemi Eitlik 7te verildii gibidir.

    y = 75.44 + 4.83x1 + 4.50x211.17x1^29.17b22x2^25.25x1x2 + e (7)

    izelge 14de, eitlik 7de verilen model denklemi kullanlarak hesaplanan tahmini verimdeerleri ve artk deerleri standardize edilmi artk deerleri ile birlikte verilmitir. izelge15de normal olaslk ktlar verilmitir. ekil 4de deneysel verim deerlerinin normalolaslk grafii verilmitir.

    izelge 14. Tahmin edilen verimler ve artklar

    Artklar

    sra tahmin y Artklar Standart artklar

    1 40.5278 0.4722 1.0806

    2 59.4444 -0.4444 -1.0170

    3 60.0278 -0.0278 -0.0636

    4 61.7778 -0.7778 -1.7798

    5 75.4444 0.5556 1.2713

    6 70.7778 0.2222 0.5085

    7 60.6944 0.3056 0.6992

    8 69.1111 -0.1111 -0.2543

    9 59.1944 -0.1944 -0.4449

  • 7/22/2019 kemometri ders notlar

    13/41

    izelge 15. Normal olaslk kts

    Olaslk kts

    Yzde y

    5.555555556 41

    16.66666667 59

    27.77777778 59

    38.88888889 60

    50 61

    61.11111111 61

    72.22222222 69

    83.33333333 71

    94.44444444 76

    ekil 4. Normal olaslk grafii

    ekil 5de deneysel verim deerleri ile model denklemi kullanlarak hesaplanan verimdeerlerinin korelasyon grafii verilmitir. ekilden de grlecei gibi olduka baarl

    tahmin deerleri elde edilmitir. ekil 6, artklarn grafiini gstermektedir.

  • 7/22/2019 kemometri ders notlar

    14/41

    ekil 5. Deneysel verim deerlerine kar hesaplanan verim deerleri.

    ekil 6. Deneysel verim deerlerine kar elde edilen artklarn grafii.

    Artklarn dalm incelendiinde normal bir dalm gsterdikleri grnmektedir. Bu

    noktada elde edilen model denklemi kullnlarak optimum artlarn belirlenmesi uygunolacaktr. Bu amala MS Excel de solver kullanlarak (Resim 3) en yksek verimi eldeedebilmek iin en uygun pH ve katalizr konsantrasyonunun belirlenebilir.

  • 7/22/2019 kemometri ders notlar

    15/41

    Resim 3.a. Optimumartlar iin solver uygulamas ilk pencere.

    Resim 3.b. Optimumartlar iin solver uygulamas ikinci pencere

    Resim 3.bde grld gibi en yksek verimin elde edildii koullar pH (x1) iin kodlanmdeer olarak 0.2304 ve katalizr konsantrasyonu (x2) iin 0.3126 olarak bulunmutur. Buradaoptimum koullarn faktrlerin gerek skalas iin kar gelen deerler Eitlik 8 ile hesaplanr.

    )()(

    ortastveyaaltorta

    ortaxkod

    (8)

  • 7/22/2019 kemometri ders notlar

    16/41

    Eitlik 8 kulanlarak pH ve katalizr konsantrasyonu (K.K.) iin optimum deerler:

    6912.6)36(

    62304.0

    pHpH

    3126.2..)23(

    2..3126.0

    KK

    KK

    Bylece pH 6.6912 ve katalizr konsantrasyonu 2.3126 M olduunda reaksiyon veriminin%76.86 olacan gryoruz. Bu noktada bulduumuz optimum arlarn dnda baka lokaloptimum blgelerin olup olamdn anlamak iin faktrlere (x1 ve x2) karlk reaksiyon

    veriminin nasl deitiini grebileceimiz boyutlu yant yzey grafiinin (ekil 7)oluturulmas faydal olacaktr.

    1

    1.5 2

    2.53

    2

    4

    6

    8

    1040

    50

    60

    70

    80

    Katalizr Konsantrasyonu (M)pH

    Verim(

    y)

    45

    50

    55

    60

    65

    70

    75

    ekil 7. Katalizr konsantrasyonu ve pHa karlk reaksiyon veriminin deiimini gsterenyant yzey grafii.

    ekil 6dan grld gibi pHn 6 ve katalizr konsantrasyonunun yaklak 2 olduublgede bir plato olumakta ve verim en yksek deerine ulamaktadr.

  • 7/22/2019 kemometri ders notlar

    17/41

    2.3 Plackett-Burman tasarm

    ok sayda faktrn etkisi incelenmek istendiinde full faktriyel ve fraksiyonelfaktriyel tasarm yntemlerin pratik olarak uygulanmas zorlamaktadr. Sadece faktrlerin

    kendi etkileri incelendii, yani faktrler arasndaki etkileimlerin nemli olmad durumlardaPlackett-Burman tasarm pratik olarak uygulanabilir. Bu tasarmda geerli olan deney says, faktr says ve retici izelge 16dagsterilmitir.

    izelge 16. Plackett-Burman tasarm iin reticiler

    Deney says Faktrler retici8 7 + + + - + - -12 11 + + - + + + - - - + -

    16 15 + + + + - + - + + - - + - - -20 19 + + - + + + + - + - + - - - - + + -24 23 + + + + + - + - + + - - + + - - + - + - - - -

    11 faktr ve 12 deneyi ieren Plackett Burman tasarm izelge 17degsterilmektedir.

    izelge17. 11 faktr iin Plackett Burman tasarm

    Bu tasarmn baz zellikleri vardr.

    Birinci satr ayn seviyeye sahiptir (-1 veya +1).

    kinci satr retici satrdr. Tablo 3teki reticilerden birisi kullanlr. Faktr says her

    zaman tek say ve deney says faktr saysndan bir fazladr.nc satr ikinci satrn bir yana kaydrlmas ile elde edilir (izelge17).

  • 7/22/2019 kemometri ders notlar

    18/41

    Btn faktrler iin yksek ve dk seviye says eittir. Bu da kolonlarn birbiri ileortagonal (kolonlar birbirinden bamsz) olduunu gsterir.

    Placktett-Burman tasarmda faktrsays deney saysndan bir dktr. 11 faktr iin12 deney yapmak gerekir. Ancak gerekte 10 faktr var ise 11. faktr sonu zerindeherhangi bir etkisi olmayan rastgele bir faktr seilir. Bu faktre dummy faktr denilir.

    Tasarm tablosuna kesim noktas (b0) ilave edildiinde kare matris elde edilir.

    3. OPTMZASYON

    3.1 Merkezi kompozit tasarm

    ki seviyeli faktriyel tasarmlar her bir faktrn etkilerini genel olarak inceleyenyntemlerdir. nemli faktrler belirlendikten sonra detayl inceleme yani optimum deerlerin

    bulunmas gerekebilir. Her bir faktrn optimum koullarnn bulunmas merkezi kompozittasarm yntemi ile yaplr. ki nedenle optimizasyona ihtiya vardr. Birincisi, deneyselsonucu etkileyen faktrlerin optimum deerlerini bulmak. rnein, organik sentezdemaksimum verimi etkileyen faktrlerin veya kromatografik ayrmada ayrma gcnetkileyen faktrlerin optimizasyonu gibi. kinci neden, her bir faktrn sonuca etkisinigsteren matematiksel modelin oluturulmas. rnein, bir rnn FTIR spektrumu ilernn zellii ve retim prosesi arasndaki iliki kurulmasna ihtiya duyulabilir.

    Faktriyel tasarmlar tekrarlanan deney says ve parabolik etkileri incelemez.Plackett-Burman ve fraksiyonel faktriyel tasarmn baz faktrlerinde, faktrler arasndakietkileimleri incelemek mmkn deildir. nemli faktrler belirlendikten sonra parabolik

    etkiler ve faktrler arasndaki etkileimler hesaplanr.Merkezi kompozit tasarmda deney says aadaki formle gre belirlenir.

    Tasarm says 122 kk (k: faktr says)

    Formldeki 2kfull faktoriyel veya fraksiyonlu faktoriyel tasarmdaki deney saylarn,2k star tasarm deney saysn ve 1 ise orta seviyedeki deney saysn gsterir. 2 kdakiseviyeler (-1) ve (+1), 2kdakiler , 1deki ise (0) dr. deeri dairesel ve ortagonaltasarma gre farkl seviyeler alr.

    Dairesel tasarmda aadaki formle gre hesaplanr.

    4 2k

    Ortagonal tasarmda ise aadaki formle gre hesaplanr.

    k

    rnek: 3 faktr (k=3) iin dairesel tasarmda = 1.682, ortagonal tasarmda =1.732 bulunur.

    rnek 2: Petrol rafinasyonunda kkrt (S) uzaklatrlmas ileminde etkin olduubelirlenen scaklk (T, oC), ak kz (V, g/sn) ve basn (P, bar) faktrlerinin optimizasyonuhedeflenmektedir. izelge 18de faktrlerin 5 ayr seviyede ald deerler kodlanm ve ham

    hallerinde verilmitir. Bu almann amac rafine edilecek olan rnde en dk kkrt

  • 7/22/2019 kemometri ders notlar

    19/41

    miktarn elde etmek iin optimum scaklk, ak hz ve basncn belirlenmesidir.

    Denemelerden elde edilen sonularppm Scinsinden hesaplanmtr.

    izelge 18. faktrl merkezi kompozit tasarmda faktrlerin ald deerler.

    Faktrler - -1 Orta +1 +

    Kodlanm -1.682 -1 0 +1 +1.682

    x1, T (oC) 334.18 341 351 361 367.82

    x2, V (g/sn) 99.54 120 150 180 200.46

    x3, P (bar) 46.64 48 50 52 53.36

    izelge 18de verilen 1.682 kodlanm seviyesindeki faktrlerin gerek deerleri aada

    verildii gibi hesaplanabilir. rnein,x2 faktr iin:

    )150180()120150(

    1502

    veya

    x

    46.20030

    150682.1

    54.9930

    150682.1

    12

    12

    xx

    xx

    Bu deerlere gre tasarm tablosu kodlanm ve kodlanmam halde aadaki ekilde(izelge 19) dzenlenir.

    izelge 19. Merkezi Kompozit Tasarm Tablosu

  • 7/22/2019 kemometri ders notlar

    20/41

    deney T (oC) V (g/sn) P (bar) x1 x2 x3 y, (ppm S)

    1 341 120 48 -1 -1 -1 68

    2 341 120 52 -1 -1 1 81

    3 341 180 48 -1 1 -1 170

    4 341 180 52 -1 1 1 200

    5 361 120 48 1 -1 -1 38

    6 361 120 52 1 -1 1 55

    7 361 180 48 1 1 -1 67

    8 361 180 52 1 1 1 62

    9 334.18 150 50 -1.6818 0 0 180

    10 367.82 150 50 1.6818 0 0 39

    11 351 99.54 50 0 -1.6818 0 17

    12 351 200.46 50 0 1.6818 0 130

    13 351 150 46.64 0 0 -1.6818 44

    14 351 150 53.36 0 0 1.6818 5515 351 150 50 0 0 0 42

    16 351 150 50 0 0 0 41

    17 351 150 50 0 0 0 43

    18 351 150 50 0 0 0 45

    19 351 150 50 0 0 0 44

    20 351 150 50 0 0 0 43

    izelge 19dakitasarmda;

    k 8 deney (23=8) iki seviyeli full faktriyel tasaqrma edeer deney saysn,

    Takip eden 7 deney (2*3+1= 7) ydz noktalarn ve bir adet orta noktadaki deneyleri,

    Son 5 deney orta seviyenin tekrar edilen deney says olmak zere toplam 20 deneyyaplmaktadr.

    Bu faktrl tasarmda ikini dereceden matematiksel model aadaki (Eitlik 9) gibigsterilebilir.

    y = b0 + b1x1 + b2x2 + b3x3 + b11x12 + b22x2

    2 + b33x32 + b12x1x2 + b13x1x3 + b23x2x3 +b123x1x2x3

    (9)

    Bu modelde;

    1 kesim noktas (b0),

    3 (=k) lineer etkileimler (b1, b2, b3),

    3 (=k) parabolik terimler (b112, b22

    2, b33

    2),

    3 ikili etkileimler (b12, b13, b23)

    terimleri bulunmaktadr.

    izelge 20de yukarda verilen eitlikteki model denklemine kar gelen deneysel tasarmizelgesi vailmitir.

  • 7/22/2019 kemometri ders notlar

    21/41

    izelge 20. kinci dereceden 3 faktrl merkezi kompozit tasarm tablosu.

    deney x1 x2 x3 x1 2 x2^2 x3^2 x1x2 x1x3 x2x3 x1x2x3 y, (ppm S)

    1 -1 -1 -1 1 1 1 1 1 1 -1 68

    2 -1 -1 1 1 1 1 1 -1 -1 1 813 -1 1 -1 1 1 1 -1 1 -1 1 170

    4 -1 1 1 1 1 1 -1 -1 1 -1 200

    5 1 -1 -1 1 1 1 -1 -1 1 1 38

    6 1 -1 1 1 1 1 -1 1 -1 -1 55

    7 1 1 -1 1 1 1 1 -1 -1 -1 67

    8 1 1 1 1 1 1 1 1 1 1 62

    9 -1.682 0 0 2.828 0 0 0 0 0 0 180

    10 1.682 0 0 2.828 0 0 0 0 0 0 39

    11 0 -1.682 0 0 2.828 0 0 0 0 0 17

    12 0 1.682 0 0 2.828 0 0 0 0 0 130

    13 0 0 -1.682 0 0 2.828 0 0 0 0 4414 0 0 1.682 0 0 2.828 0 0 0 0 55

    15 0 0 0 0 0 0 0 0 0 0 42

    16 0 0 0 0 0 0 0 0 0 0 41

    17 0 0 0 0 0 0 0 0 0 0 43

    18 0 0 0 0 0 0 0 0 0 0 45

    19 0 0 0 0 0 0 0 0 0 0 44

    20 0 0 0 0 0 0 0 0 0 0 43

    izelge 20 yakndan incelendiinde en dk kkrt deerine sahip deney 11inci srada

    verilen ve 17 ppm S deerini gsteren denemedir. Bu denemde ak scaklk iin sfrkodlanm deer, ak hz iin -1.682 ve basn iin sfr kodlanm deerler szkonusudur.Bylece, bu denemede ak hznn en dk olduu, scaklk ve basncn orta seviyedetutulmas ile en dk kkrt oranna eriildii grlmektedir. Ancak, szkonusu 20denemenin istatistiksel analizleri yapldnda farkl optimum deerlerde ortaya kabilir.Resim 4, bu rnein MINITAB ortamndaki veri analizinin adm adm nasl yapldngstermektedir.

  • 7/22/2019 kemometri ders notlar

    22/41

  • 7/22/2019 kemometri ders notlar

    23/41

    18 18 45.000 42.575 3.801 2.425 0.28

    19 19 44.000 42.575 3.801 1.425 0.17

    20 20 43.000 42.575 3.801 0.425 0.05

    R denotes an observation with a large standardized residual.

    Estimated Regression Coefficients for y, (ppm S) using data in uncoded units

    Term Coef

    Constant 29429.8T (oC) -166.968

    V (g/sn) 24.1582

    P (bar) -54.3591

    T (oC)*T (oC) 0.262546

    V (g/sn)*V (g/sn) 0.0150331

    P (bar)*P (bar) 1.26620

    T (oC)*V (g/sn) -0.0770833

    T (oC)*P (bar) -0.193750

    V (g/sn)*P (bar) -0.0104167

    20100-10-20

    99

    90

    50

    10

    1

    Residual

    Percent

    20015010050

    10

    0

    -10

    Fitted Value

    Residual

    151050-5-10

    8

    6

    4

    2

    0

    Residual

    Frequen

    cy

    2018161412108642

    10

    0

    -10

    Observation Order

    Residual

    Normal Probability Plot Versus Fits

    Histogram Versus Order

    Resim 5. MINITAB kullanlarak elde edilen modelin grafik sonularn.

  • 7/22/2019 kemometri ders notlar

    24/41

    CurHigh

    Low0.00000D

    New

    d = 0.00000

    Targ: 17.0

    y, (ppm

    y = 20.3864

    0.00000

    Desirability

    Composite

    46.640

    53.360

    99.540

    200.460

    334.180

    367.820V (g/sn) P (bar)T (oC)

    [351.7966] [116.9115] [48.9596]

    Resim 6. Elde edilen bu model kullanlarak oluturulan optimum artlar.

    200

    0

    100

    150

    200

    300

    340 350 100360

    y, ( ppm S)

    V ( g/sn)

    T (oC)

    520 50

    50

    100

    150

    48340 350 360

    y, ( ppm S)

    P (bar)

    T (oC)

    5250

    50

    100

    100

    150

    48150

    200

    y, ( ppm S)

    P (bar)

    V (g/sn)

    T (oC) 352

    V (g/sn) 117

    P (bar) 50

    Hold Values

    Surface Plots of y, (ppm S)

    Resim 7. boytutlu yant yzey grafikleri.

  • 7/22/2019 kemometri ders notlar

    25/41

    V (g/sn)*T (oC)

    360350340

    200

    175

    150

    125

    100

    P (bar)*T (oC)

    360350340

    52.5

    51.0

    49.5

    48.0

    P (bar)*V (g/sn)

    200175150125100

    52.5

    51.0

    49.5

    48.0

    T (oC) 352

    V (g/sn) 117

    P (bar) 50

    Hold Values

    >

    < 50

    50 100

    100 150

    150 200

    200 250

    250 300

    300

    y, (ppm S)

    Contour Plots of y, (ppm S)

    Resim 8. kontur grafikleri.

  • 7/22/2019 kemometri ders notlar

    26/41

    BLM II

    YNLENDRMESZ SINIFLANDIRMA VE KMELEME TEKNKLER

    KONULAR

    1. Temel Bileen Analizi (Principal Component Analysis)

    1.1. Eigen Deerler

    1.2. Verilerin Analize Hazrlanmas

    a. Merkeziletirme

    b. Standartlatrma

    c. Normalizasyon

    2. Ynlendirmesiz Kmeleme Teknikleri (Unsupervised Pattern Recognition: ClusterAnalysis)

    2.1. klit Uzakl (Euclidien distance)2.2. Manhattan uzakl (Manhattan distance)2.3. Mahalanobis uzakl (Mahalanobis distance)

    1. TEMEL BLEEN ANALZ (PRINCIPAL COMPONENT ANALYSIS, PCA)

    ok deikenli veri analizinde temel bileen analizi en ok kullanlan tekniklerden

    biridir. Temel bileen analizi rnekler ve deikenler arasndaki ilikiyi incelemek iinkullanlan bir keomoetrik yntemdir. Temel bileen analizinde X ile gsterilen bir verimatrisi, T ile gsterilen bir skore matrisi, P ile gsterilen bir loadings matrisi ve E ilegsterilen bir hata matrisi bulunur. Bu deerlerle ilgili eitlik (Eitlik 1) aadaki gibiverilebilir.

    X = TP+E (1)

    Temel bileen analizinin uygulanmasnda eitli algoritmalar kullanlmaktadr. En ok

    kullanlan algoritmalar NIPALS (Srekli olmayan en kk kareler) ve SVD ( Tek deerayrma)dr. NIPALS algoritmas istenilen sayda temel bileen hesaplamak iin kullanlr.SVD algoritmas ise temel bileenlerin tamamn hesaplamaktadr.

    PCA iin genel eitlik temel bileenlerin toplam olarak eitlik 2de aadaki gibi deyazlabilir.

    X = Ept k

    K

    k

    k

    '

    1

    (2)

    Eitlikte kbileen saysn belirtmektedir. Veri matrisinin ayrntl yaps yledir

  • 7/22/2019 kemometri ders notlar

    27/41

    Burada grld gibi ilk olarak t1skor ve p1 loadigsi ile t1p

    1arpm elde edilir.

    Eer t1p1arpmn Xmatrisinden karlrsa E1hatas hesaplanm olur. Bu hata bir sonraki

    hatay hesaplamada kullanlr. Bununla ilgili bantlar aadadr (Eitlik 3 ve 4)

    E1= Xt1p

    1

    (3)

    E2= E1t2p

    2 (4)

    ksayda bileen iin hata hesabna ynelik aadaki eitlik (Eitlik 5) kullanlmaktadr.

    Ek= Ek-1- tkp

    k (5)

    Yukardaki eitliktepksimgesiyle gsterilen loadings vektr u ekilde hesaplanr (Eitlik6).

    p

    k= tX / t t (6)

    Ayn ekilde benzer bir forml ile sckor vektr tkyle hesaplanr (Eitlik 7).

    tk= X pk/ p

    k pk (7)

    Yukardaki eitliklerde verilen loadings (ykleme) ve skor vektrleri her bir bileen iinhesaplanr ve bylece temel bileenler elde edilir.

    Temel bileen analizi hem analitik kimya ile ilgili almalarda hem dedieruygulamalarda ska kullanlan kemometrik yntemlerden biridir.

    Temel bileenlerin hesaplanmasnda kullanlan loadings ve skor deerlerinormalizasyon ve ortagonallik gibi baz nemli zelliklere sahiptir. Normalizasyon her temel

    bileendeki loadings deerlerinin karelerinin toplamnn 1e eit olmasdr (Eitlik 8).

    12

    1

    kj

    J

    j

    p

    (8)

    Eitliktepkjknc temel bileeninjinci loadingini ifade etmektedir. Ortagonallik ise

    skor veya loadinglerin kolonlarnn arpmlarnn sfra eit olmasdr (Eitlik 9).

  • 7/22/2019 kemometri ders notlar

    28/41

    01

    il

    I

    i

    iktt (9)

    1.1 Eigen Deerler

    Temel bileen analizinde eigen deerler verideki bileen saysnn bulunmasndakullanlr. En yksek eigen deeri en nemli temel bileen anlamna gelmektedir. Kemometriliteratrnde eigen deerlerine ynelik bir ok tanm bulunmaktadr. Genel istatistiksel tanm

    bir temel bileenin deiimidir. Eigen deer genellikle temel bileen skorlarnn karelerinintoplamnn rnek saysnn bir eksiine blnmesiyle elde edilir. fade matemetiksel olarakyle verilmitir (Eitlik 10).

    gk=1

    1

    2

    I

    tI

    i

    ik

    (10)

    Baz aratrmaclar ise eigen deerleri basit bir ekilde temel bileen skorlarnn karelerinintoplamn rnek saysna blerek hesaplamlardr (Eitlik 11).

    gk=I

    tI

    i

    ik1

    2

    (11)

    1.2. Verilerin Analize Hazrlanmas

    Kemometrik analizlerde ham veri byk neme sahiptir.Yaplan bir deneysel almasonrasnda elde edilen verilerin kemometrik hesaplamalarna gemeden nce verilerinzellikleri dikkatle incelenmelidir. Elde edilen veriler arasnda birbirinden ok farkl deerler

    bulunuyorsa ya da deerler aras byk dengesizlik varsa, verilerin benzer birimlereevrilmeleri veya ortalama deer etrafnda toplanmas gerekebilir. Bunun gibi durumlardaverilere merkeziletirme, standartlatrma ve normalizasyon gibi verilerin analizehazrlanmasna ynelik ilemler uygulanr.

    a) Merkeziletirme

    Kemometrik analizde veri matrisinin X simgesiyle ifade edildii ve bu matrisinsatrlarnn istunlarnn ise jsimgeleriyle gsterildii daha nce belirtilmiti. Buna gre Xijeklindeki bir veri matrisinin merkeziletirme ilemi Eitlik 12 ile u ekilde yaplmaktadr.

  • 7/22/2019 kemometri ders notlar

    29/41

    mxij= xijxj (12)

    Eitlik 12de mxijmerkeziletirme ilemi yaplm matrisi ifade etmektedir. xij iinci

    satr jinci stundaki matris elemann, xj ise her bir kolonun ortalamasn belirtmektedir.Eitlikten de grlebilecei gibi, matristeki her bir kolonun ortalamasnn kolonelemanlarndan karlmasyla matris verisinin merkeziletirme ilemi yaplm olmaktadr.Bylece matristeki her bir deer ortalama evresinde toplanm olmaktadr.

    b) Standartlatrma

    Standartlatrma ileminde ncelikle her bir kolonun ortalama ve standart sapmashesaplanr. Daha sonra kolondaki her bir elemandan kolon ortalamas karlr ve kolon

    standart sapmasna blnr. Bylece matris verisi standartlatrlm olur (Eitlik 13).

    1

    )(1

    2

    N

    xx

    xxx

    I

    i

    jij

    jij

    ij

    S

    (13)

    Eitlik 13te ijSx simgesi standartlatrma ilemi yaplm matrisi ifade eder.

    c) Normalizasyon

    Normalizasyon ilemi verilerin sabit bir deere getirilmesi ilemidir. Matris zerindenormalizasyon ilemi yaplrken nce satr elemanlar toplanr ve toplam deerler her satriin ayr ayr hesaplanr. Sonra her bir satr toplam her satrn kendi elemanlarna blnr venormalizasyon ilemi tamamlanm olur (Eitlik 14).

    I

    i

    i

    ij

    ij

    N

    x

    x

    x

    1 (14)

    Eitlik 14te ijNx simgesi normalize edilmi matrisi ifade etmektedir.

    rnek 1.Aada tabloda farkl corafi blgede yetien ayn tr zmden yaplm 21 adetarap rneine ait 13 farkl deikenin incelendii veriler verilmitir. Bu almadaki ama,

    bu verileri kullanarak szkonusu 21 adet rnei PCA analizi kullanarak doru ekilde aitolduu gruplara snflandrmaktr.

  • 7/22/2019 kemometri ders notlar

    30/41

    No X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13

    1 14.83 1.64 2.17 14 97 2.8 2.98 0.29 1.98 5.2 1.08 2.85 1045

    2 13.86 1.35 2.27 16 98 2.98 3.15 0.22 1.85 7.22 1.01 3.55 1045

    3 14.1 2.16 2.3 18 105 2.95 3.32 0.22 2.38 5.75 1.25 3.17 1510

    4 14.12 1.48 2.32 16.8 95 2.2 2.43 0.26 1.57 5 1.17 2.82 1280

    5 13.75 1.73 2.41 16 89 2.6 2.76 0.29 1.81 5.6 1.15 2.9 1320

    6 14.75 1.73 2.39 11.4 91 3.1 3.69 0.43 2.81 5.4 1.25 2.73 1150

    7 14.38 1.87 2.38 12 102 3.3 3.64 0.29 2.96 7.5 1.2 3 1547

    8 11.66 1.88 1.92 16 97 1.61 1.57 0.34 1.15 3.8 1.23 2.14 428

    9 13.03 0.9 1.71 16 86 1.95 2.03 0.24 1.46 4.6 1.19 2.48 392

    10 11.84 2.89 2.23 18 112 1.72 1.32 0.43 0.95 2.65 0.96 2.52 500

    11 12.33 0.99 1.95 14.8 136 1.9 1.85 0.35 2.76 3.4 1.06 2.31 750

    12 12.7 3.87 2.4 23 101 2.83 2.55 0.43 1.95 2.57 1.19 3.13 463

    13 12 0.92 2 19 86 2.42 2.26 0.3 1.43 2.5 1.38 3.12 278

    14 12.72 1.81 2.2 18.8 86 2.2 2.53 0.26 1.77 3.9 1.16 3.14 714

    15 12.25 3.88 2.2 18.5 112 1.38 0.78 0.29 1.14 8.21 0.65 2 855

    16 13.16 3.57 2.15 21 102 1.5 0.55 0.43 1.3 4 0.6 1.68 830

    17 13.88 5.04 2.23 20 80 0.98 0.34 0.4 0.68 4.9 0.58 1.33 415

    18 12.87 4.61 2.48 21.5 86 1.7 0.65 0.47 0.86 7.65 0.54 1.86 625

    19 13.32 3.24 2.38 21.5 92 1.93 0.76 0.45 1.25 8.42 0.55 1.62 650

    20 13.08 3.9 2.36 21.5 113 1.41 1.39 0.34 1.14 9.4 0.57 1.33 550

    21 13.5 3.12 2.62 24 123 1.4 1.57 0.22 1.25 8.6 0.59 1.3 500

    Yukarda verilen tabloda rnekler satrlarda deikenler stunlarda verilmitir. Bu veriMINITAB ortamna aktarlarak aada verilen Resimdeki gibi PCA analizigerekletirilebilir.

    ncelikle ilk iki temel bileen verideki toplam deikenliin %67.77 sini akladn aadaverilen izelgedeb grmekteyiz.

    E.V % Varian C. % Var

    6.134532 47.44872 47.44872

    2.627051 20.31943 67.76815

  • 7/22/2019 kemometri ders notlar

    31/41

    Bu noktadan haraketle PCA anlizinden gen ilk iki temel bileen skor vektrn birbirine kargrafie geirdiimizde aada verilen PCA skor grafiini elde etmi oluruz.

    43210-1-2-3-4

    3

    2

    1

    0

    -1

    -2

    PC1

    PC2

    21

    2019

    18

    17

    16

    15

    14

    13

    12

    1110

    9

    8

    7

    6

    5

    4

    3

    2

    1

    Yukarda verilen PCA skor grafiini yakndan incelediimizde ilk 7 rnein karaktesitikolarak grafiin sa alt tarafndan yer aldklarnn ve digger rneklerden net bir ekildeayrldklarn grmekteyiz. Ayn ekilde sol alt kede kmelenen 7 rnek dier bir grubugsterirken ste grnen 7 rnekte 8-14 numaral rnekleri gstermektedir. PCA analizinde,ayrca bu rneklerin gruplandrlmasnda kullanlan 13 deikenin ykleme grafiioluturulur. Aadaki ekil PCA analizinden gelen ilk iki ykleme vektrnn birbirine kar

    grafiini gstermektedir.

    0.40.30.20.10.0-0.1-0.2-0.3-0.4

    0.3

    0.2

    0.1

    0.0

    -0.1

    -0.2

    -0.3

    -0.4

    -0.5

    -0.6

    PC1

    PC2

    X13

    X12

    X11

    X10

    X9

    X8

    X7X6

    X5X4

    X3

    X2

    X1

    Yukarda verilen ykleme grafiini incelediimizde zellikle x1 ve x13 deikenleri ilk 7rnein snflandrmasnda byk rol alrken x3 ve x10 deikelnleri son 7 rnei daha iyikarakterize etmekte ve son olarak x8 ve x11 deikenleri 8-14 arasndaki rnekleri daha iyi

    snflandrm grnmektedir.

  • 7/22/2019 kemometri ders notlar

    32/41

    2. YNLENDRMESZ KMELEME ANALZ (UNSUPERVISED PATTERNRECOGNITION: CLUSTER ANALYSIS)

    Kmeleme analizi rnekler ya da deikenler arasndaki benzerliklerin gsterilmesi ve

    yorumlanmasna ynelik kimyada ska kullanlan kemometrik yntemlerden birisidir.Kmeleme analizi ile benzer rnekler ayn grup altnda toplanabilmektedir. Kmeleme analiziynlendirmesiz (unsupervised pattern recognition) ve ynlendirmeli (supervised patternrecognition) olmak zere iki ekilde yaplabilmektedir. Bu blmde ynlendirmes izkmeleme tekniinden bahsedilecektir.

    Ynlendirmesiz kmeleme tekniinde birinci adm rnekler arasndaki benzerliibelirlemektir. Tablo 1de 6 ayr kan rneinde kalsiyum ve fosfat analizi sonular verilmitir.

    izelge 1. Kan rneklerinde kalsiyum ve fosfat deerleri

    rnek Kalsiyum (mg/100mL) Fosfat (mg/100mL)1 8.0 5.52 8.25 5.753 8.7 6.34 10.0 3.05 10.25 4.06 9.75 3.5

    Kalsiyum ve fosfat ieriine gre 6 kan rnei arasnda benzerlik ilikisi kurulabilir.rnekler arasndaki benzerlik ilikisini veren ve en ok kullanlan 3 yntem aada

    aklanmtr.

    2.1. klit Uzakl(Euclidean distance)

    ki rnek (kve l) arasndaki iliki aadaki formlle verilir (Eitlik 15).

    2

    1)(

    J

    jljkjkl xxd

    (15)

    Buradaj, llen deerleri gstermektedir. xijde irneinde jlmn, yani x323.rnekteki 2. lm, Tablo 1deki 6.3 fosfat deerini gsterir. ki rnek arasndaki klituzakl kk ise bu rnekler birbirine benzerdir. klit uzakl matris formatnda aadakigibi yazlabilir (Eitlik 16).

    )').(( lklk xxxx kld (16)

    Burada izelge 1de gsterilen her bir kolon bir vektrdr. Bu forml Excel veya

    Matlabta kolaylkla hesaplanabilir.

  • 7/22/2019 kemometri ders notlar

    33/41

    2.2. Manhattan uzakl (Manhattan distance)

    klit uzaklndan biraz farkldr. rnekler arasndaki iliki benzer ekildedeerlendirilir. Manhattan uzaklnda matris tablosundaki deerler klit uzaklndan daha

    byktr. Manhattan uzakl aadaki formlle hesaplanr (Eitlik 17).

    ||1

    ljkj

    J

    jkl xxd

    (17)

    klit uzakl ile Manhattan uzakl arasndaki fark ekil 1de gsterilmitir.

    ekil 1. klit ve Manhattan uzakl ilikisi

    2.3. Mahalanobis uzakl (Mahalanobis distance)

    En sk kullanlan kemometrik yntemleden birisidir ve klit uzaklna benzerdir.Birbiri ile korelasyona sahip deikenleri dikkate alan bir yntemdir. k ve l rnekleriarasndaki ilikiyi veren uzaklk aadaki matris terimi ile hesaplanabilir (Eitlik 18).

    dkl= (xk - xl). C-1. (xk - xl)' (18)

    Burada C deikenlerin varyans-kovaryans matrisi gsterir. Deiken says rneksaysndan fazla olduunda bu metot kolaylkla uygulanamaz. nk bu durumda varyans-kovaryans matrisinin tersi yoktur.

    Kmeler aras uzaklklar farkl yntemlerle hesaplanabilir (Eitlikler 19, 20, 21, 22,23, 24 ve 25).

    a. Ortalama link (Average Likage) (Eitlik 19)

    2

    BiAi

    ki

    ddd

    (19)

    klit uzaklManhattan uzakl

  • 7/22/2019 kemometri ders notlar

    34/41

    b. Tekli link (Single Linkage)

    Bu eitlikte kmeler aras en ksa mesafe aadaki gibi hesaplanr (Eitlik 20).

    ),min(22

    BiAi

    BiAiBiAi

    ki dddddd

    d

    (20)

    c. Toplam link (Complete Linkage)

    Bu metotta kme noktalar arasndaki en geni mesafe dikkate alnarak klit uzaklhesaplanmaktadr (Eitlik 21).

    ),max(22

    BiAi

    BiAiBiAi

    ki dddddd

    d

    (21)

    d. Arlkl ortalama link (Weighted Average Linkage)

    Bu metotta kmeler aras uzakln hesaplanmasnda bileen says dikkate alnr(Eitlik 22).

    BABiB

    AiA

    ki NNNdN

    Nd

    N

    Nd (22)

    e. Merkezi (Centroid)

    Bu metotta iki kmenin merkezleri arasndaki mesafe dikkate alnarak bek uzaklhesaplanmaktadr (Eitlik 23).

    ABBA

    BiB

    AiA

    ki dN

    NNd

    N

    Nd

    N

    Nd

    2 (23)

    f. Medyan (Median)(Eitlik 24)

    422

    ABBiAi

    ki

    dddd (24)

    g. Ward metodu (Wards Method)(Eitlik 25)

    AB

    i

    iBi

    i

    iBAi

    i

    iAki d

    NN

    Nd

    NN

    NNd

    NN

    NNd

    (25)

    Yukarda verilen eitliklerde (k) ve (i) simgeleri (k) numaral kolonun (i) numaral elemannifade eder. A ve B simgeleri ise rnekleri gsterir.

  • 7/22/2019 kemometri ders notlar

    35/41

    izelge 1deki veriler dikkate alnarak rnek klit uzakl aadaki ekilde hesaplanabilir.

    Kalsiyum iin 1. ve 2. rnekler arasndaki klit uzakl,

    d12= [(8-8.25)2+ (5.5-5.75)2]1/2= 0.354 dir.

    Matristeki her rnek iin klit uzakl ayn ekilde hesaplandnda aadaki izelge 2 eldeedilir.

    izelge 2.klit uzakl tablosu

    rnek 1 2 3 4 5 61 02 0.354 0

    3 1.063 0.711 04 3.201 3.260 3.347 05 2.704 2.658 2.774 1.031 06 2.658 2.704 2.990 0.559 0.707 0

    Uzaklk matrisinin indirgenmesi rneklerin toplanmasyla yaplmaktadr. Burada kuralen ksa uzakla sahip rneklerin ilk olarak toplanmasdr. Aada toplama ilemi srasylagsterilmitir.

    1. ndirgenmi matris

    Tablo 2de grld gibi matristeki en ksa uzaklk 1. ve 2. rnekler arasndadr.Yani d12= 0.354 olmaktadr. 1. ve 2. rnek 1

    *ile gsterilen yeni birbileen olarak birletirilir

    ve aralarndaki uzaklk sfra eitlenir. Bylece rnekler arasndaki yeni uzaklk deerleriaadaki gibi hesaplanr.

    887.02

    711.0063.1

    22313

    3*1

    dd

    d

    231.32

    260.3202.32

    24144*1

    ddd

    681.22

    658.2704.2

    22515

    5*1

    dd

    d

    681.22

    704.2658.2

    22616

    6*1

    dd

    d

    1. ndirgenmi matris aadaki izelgede (izelge 3)gsterilmitir.

  • 7/22/2019 kemometri ders notlar

    36/41

    izelge 3. ndirgenmi matris

    rnek 1 3 4 5 61 03 0.887 04 3.231 3.347 05 2.681 2.774 1.031 06 2.681 2.990 0.559 0.707 0

    2. ndirgenmi matris

    Tablo 3te grld gibi matristeki en ksa uzaklk 4. ve 6. rnekler arasndadr. Yanid46= 0.559 olmaktadr. 4. ve 6. rnek 4

    * ile gsterilen yeni bir bileen olarak birletirilir vearalarndaki uzaklk sfra eitlenir. Bylece rnekler arasndaki yeni uzaklk deerleriaadaki gibi hesaplanr.

    869.02

    707.0031.1

    25654

    4*5

    dd

    d

    269.32

    990.2547.3

    26343

    3*4

    dd

    d

    956.22

    681.2231.3

    2*61*41

    *1*4

    dd

    d

    2. ndirgenmi matris izelge 4te gsterilmitir.

    izelge 4. ndirgenmi matris

    rnek 1 3 4* 51 03 0.887 04* 2.956 3.269 05 2.681 2.774 0.869 0

    3. ndirgenmi matris

    Tablo 4te grld gibi matristeki en ksa uzaklk 5. ve 4*. rnekler arasndadr.Yani d54* = 0.869 olmaktadr. 5. ve 4

    *. rnek 5

    * ile gsterilen yeni bir bileen olarakbirletirilir ve aralarndaki uzaklk sfra eitlenir. Bylece rnekler arasndaki yeni uzaklkdeerleri aadaki gibi hesaplanr.

    819.22

    956.2681.2

    2*1*451

    *5*1

    dd

    d

    813.12

    774.2887.0

    2533*4

    *35

    dd

    d

    3. ndirgenmi matris izelge 5tegsterilmitir.

  • 7/22/2019 kemometri ders notlar

    37/41

    izelge 5. ndirgenmi matris

    rnek 1* 3 5*1 0

    3 0.887 05* 2.819 1.831 0

    4. ndirgenmi matris

    izelge 5ten grld gibi matristeki en ksa uzaklk 1*. ve 3. rnekler arasndadr.Yani d1*3 = 0.887 olmaktadr. Bu veriler rnek 3

    * ile gsterilen yeni bir bileen olarak

    birletirildiinde rnekler arasndaki yeni uzaklk deerleri aadaki gibi hesaplanr.

    325.22

    274.2831.12

    3*5*1*5*5*3

    ddd

    4. ndirgenmi matris izelge 6da gsterilmitir.

    izelge 6. ndirgenmi matris

    rnek 3* 5*3* 05* 2.547 0

    Sonu olarak yukarda hesapladmz noktalar bir grafik zerinde gsterirsekaadaki dendrogram elde ederiz (ekil 2).

    ekil 2. rnekler arasndaki ilikiyi veren dendrogram.

    0

    20

    40

    60

    80

    100

    5 6 4 3 2 1

    1*

    3*5*

    4*

    Benzer

    lik

    rnekler

  • 7/22/2019 kemometri ders notlar

    38/41

    Bu hesaplamalar karmak gibi grnse de konunun anlalmas asndan yararldr.Kmeleme analizi daha kolay olarak baz hazr programlarla (Statistica gibi) dayaplabilmektedir. ekil 2de grld gibi bu rnekte iki temel kme bulunmaktadr. 1,2,3

    bir kme 4,5,6 baka bir kmeyi gstermektedir.

    rnek 2. Aada izelgede farkl corafi blgelerden elde edilmi 20 adet zeytin yarneinin ya asitleri profilini gstermektedir. Bu veriler kullanlarak PCA ve HCA analizleriyaplacak ve szkonusu 20 rnein ka farkl gruba ayrlaca belirlenmek istenmektedir.

    samples palmitic palmitoleic stearic oleic linoleic eicosanoic linolenic eicosenoic

    1 911 49 268 7924 678 51 70 44

    2 922 66 264 7990 618 49 56 29

    3 1100 61 235 7728 734 39 64 35

    4 1082 60 239 7745 709 46 83 33

    5 1037 55 213 7944 633 26 52 30

    6 1285 129 244 7323 819 57 65 36

    7 1248 107 313 7299 840 46 66 33

    8 1356 106 236 7209 866 48 75 36

    9 1260 102 228 7354 870 49 64 28

    10 1261 121 312 7238 877 47 65 25

    11 1364 204 225 6929 1084 21 50 14

    12 1410 199 216 7130 955 21 48 19

    13 1384 178 208 7105 999 29 67 26

    14 1412 185 217 6842 1203 34 72 3215 1410 232 280 6715 1233 32 60 24

    16 1136 72 341 7616 661 49 65 32

    17 926 41 277 7815 784 45 65 25

    18 1105 69 373 7714 532 51 68 37

    19 1109 79 305 7576 763 45 64 36

    20 1284 93 265 7235 893 43 77 46

    Yukarda verilen veri ncelikle MINITAB ortamna aktarlm ve PCA ve HCA analizleri ayrayr gerekletirilmitir. Yukarda PCA rnei verilirken MINITAB ortamnda analizin nasl

    balatld bir resim ile verilmiti. Bu nedenle burada sadece HCA analizi nasl balatlyorzerinde durulacak ve aada verilen resim HCA analizinin emasn gstermektedir.

  • 7/22/2019 kemometri ders notlar

    39/41

    Yukarda MINITAB alma sayfasnda gsterilen veriler ncelikle PCA analizine tabitutulmu ve szkonusu 20 rnein nasl snfland aada verilen ilk iki temel bileen skorvektrnn birbirine kar grafii izilerek gsterilmitir.

    3210-1-2-3-4

    3

    2

    1

    0

    -1

    -2

    PC1

    PC2

    20

    19

    18

    17

    16

    15

    14

    13

    1211

    10

    9

    8

    7

    6

    5

    4

    3

    2

    1

    PCA analizinden gelen ilk iki skor vektrnn grafiini incelediimizde rneklerin genelolarak alt gruba ayrldn syleyebiliriz. Aada verilen izelgede PCA analizinde ilk ikitemel bileen vektrnn verideki toplam deikenliin %79.42siniakladn te yandanilk drt temel bileenin ise %95 civarndaki varyans kapsadn grmekteyiz.

  • 7/22/2019 kemometri ders notlar

    40/41

    Eigenval % Varia C.% Var

    4.690292 58.62865 58.62865

    1.663256 20.7907 79.41935

    0.893089 11.16362 90.58297

    0.295994 3.699921 94.28289

    0.245336 3.066701 97.34959

    0.159076 1.98845 99.33804

    0.050536 0.631696 99.96974

    0.002421 0.030264 100

    8

    PCA analizinden sonra yaplan HCA analizinde ncelikle ham veriler kullanlarakdendrogram oluturulmu ve elde edilen dendrogram aadaki ekilde verilmitir.

    1514131211208107961819165317241

    19.67

    13.11

    6.56

    0.00

    rnekler

    Uzaklk

    Ward Linkage, Euclidean Distance

    Yukarda verilen dendrogram yakndan incelendiinde 11, 12, 13, 14 ve 15 numaral

    rneklerin bamsz bir grup olarak snflandrld grlmektedir. te yandan, geriye kalan15 rnekten 6, 7, 8, 9, 10 ve 20 numaral rneklerin bir baka alt grubu oluturduu ve sonolarak dendrogramn sol tarafndaki 10 rnein bir baka alt grubu oluturduugrlmektedir. Daha sonar HCA analizi, ham veriler yerine, PCA analizinden gelen ve verisetindeki toplam varyansn %95ini kapsayan ilk 4 temel bileen skor vektr kullanlarakoluturulmu ve elde edilen dendrogram aada verilmitir.

  • 7/22/2019 kemometri ders notlar

    41/41

    1514131211107209861819165172341

    20.10

    13.40

    6.70

    0.00

    rnekler

    Uzaklk

    Ward Linkage, Euclidean Distance

    Yukarda verilen dendrogram incelendiinde ham veriler ile elde edilen dendrogramn hemenhemen aynsnn PCA analizinden gelen ilk drt temel bileen vektr ile de elde edilebildiigrlmektedir.