as714 final project กลุ่ม 10

118
Present to Present to Dr. Wannapa (Kay) Mahamaneerat Dr. Wannapa (Kay) Mahamaneerat By By Group 10 (DTM#2) Group 10 (DTM#2)

Upload: meoland

Post on 15-Nov-2014

106 views

Category:

Documents


0 download

DESCRIPTION

WEKA 3.6.1

TRANSCRIPT

Page 1: AS714 Final Project กลุ่ม 10

Present toPresent to

Dr. Wannapa (Kay) MahamaneeratDr. Wannapa (Kay) Mahamaneerat

ByBy

Group 10 (DTM#2)Group 10 (DTM#2)

Page 2: AS714 Final Project กลุ่ม 10
Page 3: AS714 Final Project กลุ่ม 10
Page 4: AS714 Final Project กลุ่ม 10

• เปิ�ดตั�ว Version แรกของ WEKA คื�อ version 2.1

Page 5: AS714 Final Project กลุ่ม 10
Page 6: AS714 Final Project กลุ่ม 10

WEKA ย่�อมาจาก Waikato Environment for Knowledge Analysis

WEKA เปิ�น Software free ที่��สามารถ download ภาย่ใตั� GNU General Public License

เข�ย่นโดย่ใช้�ภาษา Java ที่�#งหมด สร�างข%#นมาโดย่เน�นก�บ การเร�ย่นร' �ด�วย่เคืร��อง (Machine

Learning) ก�บการที่(าเหม�องข�อม'ล ม�โมด'ลย่�อย่ส(าหร�บจ�ดการข�อม'ล ใช้� Graphic User Interface / GUI และคื(าส��งในการ

ส��งให� Software ปิระมวลผล

Page 7: AS714 Final Project กลุ่ม 10

การพั�ฒนาของ WEKA Version เร.�มตั�น

เปิ�น Non-Java เปิ�น TCL/TK front-end ในการสร�างแบบจ(าลองและที่ฤษฎี�ที่��น(าไปิใช้�ก�บโปิรแกรมภาษาอ��นๆ รวมที่�#งการจ�ดเตัร�ย่มข�อม'ลในภาษา C และ Make file based System ส(าหร�บการ Run Machine Learning Experiments ใช้�ในการว.เคืราะห3ข�อม'ลด�านการเกษตัร

ตั�#งแตั� Version 3 เปิ�น Fully-Java โดย่เร.�มพั�ฒนาในปิ4 1997

ปิ5จจ6บ�นน(าไปิใช้�ปิระโย่ช้น3ในสาขาอ��นๆ ที่�#งด�านการศึ%กษาและว.จ�ย่

Page 8: AS714 Final Project กลุ่ม 10

สามารถ run บน Hardware และ OS ที่��วๆไปิ เน��องจาก WEKA พั�ฒนามาจาก Java

โปิรแกรม WEKA ตั.ดตั�#งง�าย่ โดย่ สามารถ download ได�ที่�� http://www.cs.waikato.ac.nz/ml/weka/

โปิรแกรมเปิ�นแบบ Self-installer สามารถที่(าตัามข�#นตัอนการตั.ดตั�#งจนเสร8จส.#นการตั.ดตั�#ง

Page 9: AS714 Final Project กลุ่ม 10

1.เปิ�น Free ware ที่��สามารถ download ได�ภาย่ใตั� GUN (General Public License) และสามารถเข�าถ%ง source code เพั��อน(าไปิพั�ฒนาตั�อย่อดได�2. สามารถใช้�ร�วมก�บโปิรแกรมอ��นๆ ได�ง�าย่ เพัราะเข�ย่นด�วย่ภาษา Java ด�งน�#น จ%งสามารถ Run ได�บนที่6กๆ Platform และม�เคืร��องม�อในการเช้��อมตั�อ SQL Database โดย่ใช้� Java Database connectivity และสามารถส�บคื�นข�อม'ลจาก database query ได�3. สามารถ convert ข�อม'ลผ�าน database link ไปิเปิ�น flat file format ที่��เหมาะสมก�บการ process ใน WEKA

4. ได�รวบรวมช้6ดเคืร��องม�อในการที่(า data preparation และ เที่คืน.คืการสร�าง Model

Page 10: AS714 Final Project กลุ่ม 10

7. โปิรแกรม WEKA ม�อ�ลกอร.ที่%มที่��ร' �จ�กก�นด�ของการที่(าดาตั�าไมน3น.�งให�เล�อกใช้�อย่�างคืรบถ�วน และสามารถเข�ย่นฟั5งก3ช้�นเพั.�มเข�าไปิในโปิรแกรมเองได�

5. ม�ล�กษณะการใช้�งานง�าย่ เน��องจากม� GUI ที่��ใช้�ส(าหร�บผ'�เร.�มตั�น6. WEKA สามารถร�บม�อก�บข�อม'ลที่��ม�ขนาดใหญ่� ซึ่%�งสามารถว.เคืราะห3บน remote machine หร�อ server หลาย่เคืร��องที่(าพัร�อมๆ ก�น (WEKA Server) Technology น�#เร�ย่ก “Grid WEKA” ซึ่%�งง�าย่ตั�อการ setup และใช้� resource จาก server หลาย่ๆ เคืร��อง ช้.#นงานตั�างๆ จะถ'ก process แย่กอย่'�บน server แตั�ละเคืร��องที่��ม� CPU หลาย่ตั�วในการ processing

Page 11: AS714 Final Project กลุ่ม 10

Simple CLI (Command Line Interface)

Explorer Experimenter

KnowledgeFlow ArffViewer

Log

โปิรแกรมร�บคื(าส��งการที่(างานผ�านการพั.มพั3

โปิรแกรมที่��ออกแบบในล�กษณะ GUI

โปิรแกรมที่��ออกแบบการที่ดลองและการที่ดสอบผล

โปิรแกรมออกแบบผ�งการไหลของคืวามร' �

โปิรแกรมที่��ใช้�ส(าหร�บแก�ไขแฟั=มปิระเภที่ Arff

โปิรแกรมที่��ใช้�อ�านข�อคืวามบ�นที่%กเก8บระหว�างการที่(างาน

Page 12: AS714 Final Project กลุ่ม 10

ข�อม'ลข�อม'ล

เล�อก Target table ในร'ปิ

ARFF

ปิระมวลผล Filter ที่��เหมาะสม

เล�อกว.ธี�การ ข�#นตัอนว.ธี�

และพัาราม.เตัอร3

ตั�วแบบตั�วแบบ

Page 13: AS714 Final Project กลุ่ม 10
Page 14: AS714 Final Project กลุ่ม 10
Page 15: AS714 Final Project กลุ่ม 10

แฟั=มข�อม'ลที่��ร �บตั�องอย่'�ในร'ปิแบบ ASCII อาจเปิ�น arff, csv, C45

ในกรณ�แฟั=มข�อม'ลอย่'�ในเคืร�อข�าย่ผ'�ใช้�สามารถเร�ย่กใช้�โดย่อาศึ�ย่ URL

หร�ออาจใช้�ข�อม'ลที่��อย่'�ในฐานข�อม'ลที่��เช้��อมโย่งผ�าน JDBC

Page 16: AS714 Final Project กลุ่ม 10

ARFF = Attribute-Relation File Format เก8บโดย่ใช้� ASCII

@relation name เปิ�นบรรที่�ดที่��บอกช้��อตัารางข�อม'ลเช้.งส�มพั�นธี3

@attribute att-name type เปิ�นบรรที่�ดที่��บอกช้��อล�กษณะปิระจ(าและช้น.ด numeric หร�อ real หมาย่ถ%งล�กษณะปิระจ(าเก8บเปิ�นตั�วเลข (v1, v2, …, vn) หมาย่ถ%งล�กษณะปิระจ(าเก8บคื�าไม�ตั�อเน��อง

@data เปิ�นบรรที่�ดที่��บอกถ%งแถวที่��ตัามมาจะเปิ�นข�อม'ล แถวละหน%�งระเบ�ย่นเร�ย่งตัามล�กษณะปิระจ(าที่��บอกไว�ข�างตั�น คื��นด�วย่คือมมา

Page 17: AS714 Final Project กลุ่ม 10

@relation weather

@attribute outlook {sunny, overcast, rainy}

@attribute temperature real

@attribute humidity real

@attribute windy {TRUE, FALSE}

@attribute play {yes, no}

@data

sunny,85,85,FALSE,no

sunny,80,90,TRUE,no

overcast,83,86,FALSE,yes

rainy,70,96,FALSE,yes

rainy,68,80,FALSE,yes

rainy,65,70,TRUE,no

overcast,64,65,TRUE,yes

sunny,72,95,FALSE,no

sunny,69,70,FALSE,yes

rainy,75,80,FALSE,yes

sunny,75,70,TRUE,yes

overcast,72,90,TRUE,yes

overcast,81,75,FALSE,yes

rainy,71,91,TRUE,no

Page 18: AS714 Final Project กลุ่ม 10

สร6ปิคื�าสถ.ตั.ของล�กษณะปิระจ(าที่��ถ'ก

เล�อกกราฟัหน%�งตั�วแปิร

ของล�กษณะปิระจ(าที่��ถ'กเล�อกไว�

ราย่การของล�กษณะปิระจ(าที่��เล�อกได�

Page 19: AS714 Final Project กลุ่ม 10

จ(านวนล�กษณะปิระจ(าที่��ม�ที่�#งหมด 5 ตั�วเร�ย่งตัามล(าด�บด�งน�#outlook, temperature, humidity, windy, play

ม�จ(านวนระเบ�ย่นที่�#งหมด 14 ระเบ�ย่น ส(าหร�บล�กษณะปิระจ(า outlook เปิ�นล�กษณะปิระจ(า

ปิระเภที่ Nominal ที่��พั.จารณาไม�ม�ข�อม'ลในระเบ�ย่นที่��ขาดหาย่ไปิ ม�คื�าที่��แตักตั�างก�นที่�#งหมด 3 คื�า ซึ่%�งแตั�ละคื�าไม�ม�เพั�ย่งคื�าเด�ย่วเลย่

คื�าของล�กษณะปิระจ(าคื�อ sunny ม� 5 ระเบ�ย่น overcast ม� 4 ระเบ�ย่น rainy ม� 5 ระเบ�ย่น

Page 20: AS714 Final Project กลุ่ม 10
Page 21: AS714 Final Project กลุ่ม 10

ใช้�โปิรแกรมในการสร�าง text file ใดก8ได� เช้�น notepad บรรที่�ดแรกให�ใส� @relation relation_name บรรที่�ดถ�ดมาให�ใส�ล�กษณะปิระจ(าเร�ย่งตัามล(าด�บ

@attribute att_name value ได� @data ข�อม'ลใส�เร�ย่งตัามล(าด�บการปิรากฏของล�กษณะ

ปิระจ(า@data1,2,3,4

Page 22: AS714 Final Project กลุ่ม 10

ใช้�โปิรแกรมในการสร�าง text file ใดก8ได� เช้�น notepad บรรที่�ดแรกให�ใส� @relation relation_name บรรที่�ดถ�ดมาให�ใส�ล�กษณะปิระจ(าเร�ย่งตัามล(าด�บ

@attribute att_name value ได� @data ข�อม'ลใส�เร�ย่งตัามล(าด�บการปิรากฏของล�กษณะ

ปิระจ(า@data1,2,3,4

Page 23: AS714 Final Project กลุ่ม 10

ID,SEX,PASS/FAIL,Score,Class

1,M,Pass,45.5,B2,F,Pass,56.78,B3,M,Pass,89,A4,F,Pass,77,A5,M,Fail,32,C6,F,Fail,12,D7,M,Fail,35,C8,F,Pass,62,B9,M,Pass,68,B+10,F,Fail,10,D

Page 24: AS714 Final Project กลุ่ม 10
Page 25: AS714 Final Project กลุ่ม 10

สถ.ตั.หน%�งตั�วแปิร (Univariate Statistic) เปิ�นการว.เคืราะห3สถ.ตั.ที่��ใช้�เพั�ย่งหน%�งล�กษณะปิระจ(า = ตั�วแปิร ปิระกอบด�วย่ ช้��อของล�กษณะปิระจ(า ช้น.ดของล�กษณะปิระจ(า ม�เพั�ย่งสองช้น.ดคื�อ Nominal หร�อ

Numeric จ(านวนข�อม'ลที่��ขาดหาย่ไปิเที่�ย่บเปิ�นเปิอร3เซึ่8นตั3ก�บจ(านวนข�อม'ลที่�#งหมด คื�าที่��แตักตั�างก�นที่�#งหมดในล�กษณะปิระจ(า คื�าที่��ม�เพั�ย่งคื�าเด�ย่ว คื.ดเปิ�นเปิอร3เซึ่8นตั3เที่�ย่บก�บคื�าที่�#งหมด

Page 26: AS714 Final Project กลุ่ม 10

ช้��อล�กษณะปิระจ(า SEX ช้น.ดของคื�าของล�กษณะปิระจ(าเปิ�น

Nominal ในล�กษณะปิระจ(าน�#ไม�ม�คื�าที่��หาย่ไปิ คื�าที่��แตักตั�างก�นม�เพั�ย่งสองคื�าคื�อ M

ก�บ F คื�าที่��เปิ�น M ม�จ(านวน 5 ตั�ว คื�าที่��เปิ�น F ม�จ(านวน 5 ตั�ว คื�าที่��ไม�ซึ่(#าไม�ม�

Page 27: AS714 Final Project กลุ่ม 10

ช้��อล�กษณะปิระจ(า Score ช้น.ดของคื�าของล�กษณะปิระจ(าเปิ�น Numeric ในล�กษณะปิระจ(าไม�ม�ข�อม'ลที่��ขาดหาย่ไปิ จ(านวนคื�าที่��แตักตั�างก�นที่�#งหมดม� 10 ตั�ว คื�าแตั�ละตั�วม�เพั�ย่งหน%�งเด�ย่ว (ไมม�คื�าที่��ซึ่(#าก�นเลย่)

คื�าตั(�าส6ด Minimum = 10 คื�าส'งส6ด Maximum = 89 คื�าเฉล��ย่เลขคืณ.ตั Mean = 48.728 ส�วนเบ��ย่งเบนมาตัรฐาน StdDev = 26.585

Page 28: AS714 Final Project กลุ่ม 10

ซึ่อฟัตั3แวร3 WEKA สามารถแสดงกราฟัในม6มมองของแตั�ละล�กษณะปิระจ(าโดย่ใช้�กราฟัแที่�ง โดย่กดที่�� Visualize all

Page 29: AS714 Final Project กลุ่ม 10

ซึ่อฟัตั3แวร3 Weka แสดงกราฟัระหว�างล�กษณะปิระจ(าสองล�กษณะแถบ Visualize

กราฟัด�งกล�าวเร�ย่กว�า Scatter plot ซึ่%�งแตั�ละจ6ดแสดงระเบ�ย่นหน%�งระเบ�ย่น แตั�ละแกนแที่นคื�าของล�กษณะปิระจ(าแตั�ละคื�า

เราปิร�บขนาดของกราฟัโดย่เปิล��ย่น PlotSize และเปิล��ย่นขนาดของจ6ด โดย่เปิล��ย่น PointSize แล�วกดปิ6Bม Update

ส�ของจ6ดส��อแตั�ละคืลาสที่��ปิรากฎีในข�อม'ล

Page 30: AS714 Final Project กลุ่ม 10

ซึ่อฟัตั3แวร3 Weka สามารถเล�อกแสดงกราฟัของสองล�กษณะปิระจ(าคื'�ใดๆ

กดปิ6Bม Select Attributes แล�วเล�อกเฉพัาะล�กษณะปิระจ(าที่��ตั�องการพั.จารณา (กด Ctrl

ระหว�างเล�อก) กดปิ6Bม Update

Page 31: AS714 Final Project กลุ่ม 10

ซึ่อฟัตั3แวร3 Weka คื(านวณหาสมการถดถอย่เช้.งเส�น เฉพัาะล�กษณะปิระจ(าที่��เปิ�นจ(านวน น(าข�อม'ลเข�าซึ่อฟัตั3แวร3 Weka เล�อกแถบ Classify ในกล6�มของโมด'ล Classifier กด Choose เล�อกฟั5งก3ช้�น

(Functions) แล�วเล�อก LinearRegression เปิล��ย่น Test Option ให� Use Training Set เล�อกล�กษณะปิระจ(าใตั�กล�อง Test Option เฉพัาะที่��ม� (Num) ข�าง

หน�า กด Start ผลล�พัธี3จะแสดงในกล�อง Classifier Output

Page 32: AS714 Final Project กลุ่ม 10
Page 33: AS714 Final Project กลุ่ม 10

ในกรณ�ที่��ล�กษณะปิระจ(าที่��ตั�องการไม�ใช้�จ(านวน ให�ใช้� Logistic Regression น(าข�อม'ลเข�าซึ่อฟัตั3แวร3 Weka เล�อกแถบ Classify ในกล6�มของโมด'ล Classifier กด Choose เล�อก

ฟั5งก3ช้�น (Functions) แล�วเล�อก Logistic เปิล��ย่น Test Option ให� Use Training Set เล�อกล�กษณะปิระจ(าใตั�กล�อง Test Option เฉพัาะที่��ม�

(Nom) กด Start ผลล�พัธี3จะแสดงในกล�อง Classifier Output

Page 34: AS714 Final Project กลุ่ม 10
Page 35: AS714 Final Project กลุ่ม 10

ตั�วกรอง (Filters) รวบรวมโมด'ลในข�#นการเตัร�ย่มข�อม'ล ตั�วกรองแบ�งออกเปิ�นสองล�กษณะ คื�อ

Supervised รวมโมด'ลที่��แปิลงข�อม'ลแบบอ�ตัโนม�ตั.ที่��ม�การคืวบคื6มด�วย่พัาราม.เตัอร3ที่�ผ'�ใช้�ก(าหนด แบ�งเปิ�นสองหมวดใหญ่�คื�อ ล�กษณะปิระจ(า (attribute) ก�บข�อม'ลแตั�ละระเบ�ย่น (instance)

Unsupervised รวมโมด'ลที่��แปิลงข�อม'ลที่��ผ'�ก(าหนดเอง แบ�งเปิ�นสองหมวดใหญ่�คื�อ ล�กษณะปิระจ(า (attribute) ก�บข�อม'ลแตั�ละระเบ�ย่น (instance)

Page 36: AS714 Final Project กลุ่ม 10

ล�กษณะปิระจ(า (Attribute) AttributeSelection

ตั�วกรองที่��เล�อกล�กษณะปิระจ(าที่��น(ามาว.เคืราะห3แบบอ�ตัโนม�ตั. โดย่ผ'�ใช้�ก(าหนดตั�วปิระเม.นในกล�อง evaluator และว.ธี�การคื�นในกล�อง search

ClassOrder ตั�วกรองเร�ย่งล(าด�บคืลาส โดย่ผ'�ใช้�ก(าหนดการเร�ย่งในกล�อง

classOrder และ seed Discretize

ตั�วกรองแปิลงคื�าตั�อเน��องให�ไปิเปิ�นคื�าที่��ไม�ตั�อเน��อง โดย่ผ'�ใช้�เล�อกล�กษณะปิระจ(าที่��ตั�องการเปิล��ย่นในกล�อง attributeIndicates และผ'�ใช้�ก(าหนดตั�วเล�อก

NorminalToBinary ตั�วกรองแปิลงคื�า Nominal ให�เปิ�นคื�า Binary โดย่ผ'�ใช้�ก(าหนดคื�าตั�ว

เล�อก

Page 37: AS714 Final Project กลุ่ม 10

ล�กษณะระเบ�ย่น (Instance) Resample

ตั�วกรองที่��ใช้�ส6�มเล�อกตั�วอย่�าง โดย่ม�การส6�มแบบแที่นคื�ากล�บคื�น โดย่ผ'�ใช้�ก(าหนดคื�าจ(านวนตั�วอย่�างในกล�อง sampleSizePercent

SpreadSubsample ตั�วกรองที่��ใช้�ส6�มเล�อกตั�วอย่�างที่�ม�การก(าหนดส�ดส�วนการกระจาย่ โดย่ผ'�

ใช้�ก(าหนดคื�าการกระจาย่ในกล�อง distributionSpread StratifiedRemoveFolds

ตั�วกรองที่��ใช้�ส6�มเล�อกกล6�มตั�วอย่�างออกเปิ�นช้6ด fold โดย่ผ'�ใช้�ก(าหนดตั�วเล�อก

Page 38: AS714 Final Project กลุ่ม 10

ล�กษณะปิระจ(า (Attribute) Add AddCluster AddExpression AddID AddNoise AddValues Center ChangeDateFormat ClassAssigner ClusterMembership Copy Discretize

(unsupervised) EMImputation FirstOrder InterquartileRange

ล�กษณะปิระจ(า (Attribute) KernelFilter MakeIndicator MathExpression MergeTwoValues MultiInstanceToProposit

ional NominalToBinary

(unsupervised) NominalToString Normalize (attribute) NumericCleaner NumericToBinary NumericToNominal NumericTransform Obfuscate PartitionedMultiFilter PKIDiscretize PrincipalComponents

(filter)

ล�กษณะปิระจ(า (Attribute) PropositionalToMul

tiInstance RandomProjection RandomSubset RELAGGS Remove RemoveType RemoveUseless Reorder ReplaceMissingVal

ues SortLabels Standardize StringToNominal StringToWordVecto

r SwapValues TimeSeriesDelta TimeSeriesTranslat

e Wavelet

Page 39: AS714 Final Project กลุ่ม 10

แสดงคืวามส�มพั�นธี3ของเหตั6การณ3หร�อว�ตัถ6 ที่��เก.ดข%#นพัร�อมก�น

ใช้�ก�บ Market Basket Analysis กฏบ�งบอกพัฤตั.กรรมการซึ่�#อของล'กคื�า โดย่ที่��วไปิใช้�ก�บฐานข�อม'ลเช้.งส�มพั�นธี3ที่��บ�นที่%กเปิ�น

Transaction โดย่ที่��แตั�ละระเบ�ย่นคื�อการซึ่�#อส.นคื�าในหน%�งคืร�#ง

ผลล�พัธี3ที่��ตั�องการได�คื�อ กฏแสดงคืวามส�มพั�นธี3ของการซึ่�#อส.นคื�าตั�างช้น.ดก�นโดย่ไม�ข%#นอย่'�ก�บล'กคื�าคืนใดคืนหน%�ง

Page 40: AS714 Final Project กลุ่ม 10

การเตร�ยมแฟ้�มข้ อม�ล ล�กษณะปิระจ(าของส.นคื�าคื�อช้��อส.นคื�าที่��พั.จารณา ล�กษณะปิระจ(าตั�วแรกคื�อรห�สการซึ่�#อส.นคื�า TID ที่��ไม�น(ามา

ใช้�ในการว.เคืราะห3 ใช้�เพั��อการเช้��อมโย่งกล�บไปิย่�งฐานข�อม'ลเร.�มตั�นเที่�าน�#น

คื�าในล�กษณะปิระจ(าเปิ�น Boolean เช้�นก(าหนดคื�าที่��เปิ�นไปิได�คื�อ y แที่นการใช้�ตั�วเลข 1

ตั�วอย่�าง การซึ่�#อ T100,I1,I2 เข�ย่นเปิ�น T100, 1, 1, ?, ?, ?

ในซึ่อฟัตั3แวร3 Weka ส�ญ่ล�กษณ3 ? แที่นคื�าที่��หาย่ไปิ (missing value)

ข้ อม�ลที่��นำ�ามาใช้

Page 41: AS714 Final Project กลุ่ม 10
Page 42: AS714 Final Project กลุ่ม 10
Page 43: AS714 Final Project กลุ่ม 10
Page 44: AS714 Final Project กลุ่ม 10

o ปิร�บคื�า min support ในกล�อง lowerBoundMinSuport เช้�น 0.2 (หมาย่ถ%งคื�าสน�บสน6นตั(�าส6ด 20%)oปิร�บคื�า min confidence ในกล�อง minMetric โดย่ metricType เปิ�น Confidence เช้�น 0.5 (หมาย่ถ%งคื�าคืวามเช้��อม��นตั(�าส6ด 50%)o ปิร�บจ(านวนกฎีที่��แสดงผลในกล�อง numRules เช้�น 100

ตั�วแบบ

Page 45: AS714 Final Project กลุ่ม 10
Page 46: AS714 Final Project กลุ่ม 10

คืวามหมาย่ของกฎีที่�� 1:การซึ่�#อส.นคื�าของล'กคื�าที่��ม�ส.นคื�า I5 แล�วจะม�ส.นคื�า I1 เสมอ

คืวามหมาย่ของกฎีที่�� 2:การซึ่�#อส.นคื�าของล'กคื�าที่��ม�ส.นคื�า I4 แล�วจะม�ส.นคื�า I2 เสมอ

Page 47: AS714 Final Project กลุ่ม 10

การที่(าเหม�องข�อม'ลแบบกฎีเช้��อมโย่งสามารถน(าไปิใช้�ก�บข�อม'ลที่��ไม�ใช้� transaction ได� โดย่ใช้�การเข�ารห�สของล�กษณะปิระจ(าเปิ�นช้น.ด Nominal หร�อ Ordinal

ซึ่อฟัตั3แวร3 Weka ใช้�การเข�ารห�ส dummy coding คื�อซึ่อฟัตั3แวร3จะแปิลงคื�าของ Nominal หร�อ Ordinal หน%�งคื�าแที่นด�วย่ตั�วแปิรที่ว.ภาคื เช้�น

ล�กษณะปิระจ(า outlook ม�คื�าที่��เปิ�นไปิได�คื�อ overcast, sunny, rainy แล�วตั�วแปิรที่ว.ภาคืเข�ย่นได�เปิ�น outlook = overcast, outlook = sunny, outlook = rainy

Page 48: AS714 Final Project กลุ่ม 10

ผลล�พธ์�ที่��ได้ จาก weather.nominal.arff

Page 49: AS714 Final Project กลุ่ม 10

คืวามหมาย่ของกฎีที่�� 1:ถ�าสภาพัอากาศึเปิ�น overcast แล�ว play = yes เสมอ

คืวามหมาย่ของกฎีที่�� 2:ถ�าอ6ณหภ'ม.เปิ�น cool แล�วคืวามช้�#นจะปิรกตั. (narmal) เสมอ

คืวามหมาย่ของกฎีที่�� 3:ถ�าคืวามช้�#นปิรกตั.และไม�ม�ลม windy = FALSE แล�ว play = yes เสมอ

Page 50: AS714 Final Project กลุ่ม 10

แฟั=มข�อม'ลที่��ถ'กน(ามาใช้�ในการว.เคืราะห3ตั�องปิระกอบด�วย่ล�กษณะปิระจ(าที่��เปิ�น Nominal หร�อ Ordinal เที่�าน�#น

ข�อม'ลในล�กษณะ transaction เปิ�นข�อม'ล Nominal และการไม�ซึ่�#อใช้�? (missing value) แที่น

TID, atri_1, attri_2,…, attri_n เม��อ TID แที่นรห�สการซึ่�#อและแตั�ละ attri_i ม�คื�า y

หร�อ ? เล�อก Associate และใช้� Apriori ใตั� Associator ปิร�บคื�าพัาราม.เตัอร3 min support ก�บ min

confidence และ numRules ที่��ตั�องการแล�วส��งให�ปิระมวลผล

Page 51: AS714 Final Project กลุ่ม 10

เปิ�นการสร�างตั�วแบบ Classification ที่��สามารถแบ�งแย่กข�อม'ล ออกตัามล�กษณะเปิ=าหมาย่ที่��ก(าหนด เพั��อระบ6ปิระเภที่ของข�อม'ล

ตั�วแบบที่��ตั�องการอาจเปิ�น Bayes ตั�วแบบเช้.งคืวามน�าจะเปิ�น Functions ตั�วแบบในร'ปิของฟั5งก3ช้�น Lazy ตั�วแบบที่��เก8บตั�วอย่�าง การตั�ดส.นใจเก.ดเม��อตั�วอย่�าง

ใหม�ถ'กน(าเข�าเที่�าน�#น Meta การที่(าตั�วแบบให�ด�ข%#น โดย่การเร�ย่นร' �ข�อม'ลเมตัา Misc ว.ธี�การสร�างตั�วแบบว.ธี�อ��น Trees ว.ธี�การสร�างตั�วแบบโดย่ใช้�ตั�นไม� Rules ว.ธี�การสร�างตั�วแบบโดย่ใช้�กฏ

Page 52: AS714 Final Project กลุ่ม 10

ล�กษณะประจ�าเป�าหมายล�กษณะประจ�าเป�าหมายเป%นำล�กษณะประจ�าสุ'ด้ที่ ายเป%นำล�กษณะประจ�าสุ'ด้ที่ าย

ในำตารางในำตาราง

ต�วอย*างม�ที่�+งหมด้ ต�วอย*างม�ที่�+งหมด้ 14 14 ต�วอย*าง และม�ล�กษณะต�วอย*าง และม�ล�กษณะประจ�าที่��ไม*ใช้*ล�กษณะประจ�าที่��ไม*ใช้*ล�กษณะประจ�าเป�าหมาย ประจ�าเป�าหมาย 4 4 ต�วต�ว

Page 53: AS714 Final Project กลุ่ม 10

ก(าหนดล�กษณะปิระจ(าเปิ=าหมาย่ให�เปิ�นล�กษณะปิระจ(าส6ดที่�าย่

เล�อกว.ธี�การสร�างตั�วแบบโดย่ใช้�ตั�นไม� ด�งน�#นตั�องเปิล��ย่นล�กษณะปิระจ(าที่��ม�คื�าตั�อเน��องให�เปิ�นล�กษณะปิระจ(าที่��ม�คื�าไม�ตั�อเน��อง

กรณ�ที่��ม�ระเบ�ย่นน�อย่ อาจใช้� k-fold cross validation หร�อ leave-one-out

กรณ�ที่��ม�ระเบ�ย่นมาก คืวรแบ�งก�#นระเบ�ย่นบางส�วนเปิ�น validation, test data และที่��เหล�อน(ามาใช้�เปิ�น training data ส�ดส�วนที่��ใช้�อาจเปิ�น 3/10 ก�บ 4/10

Page 54: AS714 Final Project กลุ่ม 10

เร.�มการที่(างานของ WEKA โดย่เปิ�ด โมด'ล Explorer เปิ�ดแฟั=ม weather.nominal.arff แปิลงล�กษณะปิระจ(าที่��ม�คื�าตั�อเน��องเปิ�น

ล�กษณะปิระจ(าที่��ม�คื�าไม�ตั�อเน��องโดย่ใช้� filter ก�อนเล�อกแถบ Classify

Page 55: AS714 Final Project กลุ่ม 10

OutlookOutlook ม�ค่*าม�ค่*าต*างก�นำ ต*างก�นำ 3 3 ค่*าค่*า

Page 56: AS714 Final Project กลุ่ม 10

temperaturetemperature ม�ค่*าต*างก�นำ ม�ค่*าต*างก�นำ 3 3 ค่*าค่*า

Page 57: AS714 Final Project กลุ่ม 10

humidityhumidity ม�ค่*าม�ค่*าต*างก�นำ ต*างก�นำ 2 2 ค่*าค่*า

Page 58: AS714 Final Project กลุ่ม 10

windywindy ม�ค่*าต*างก�นำ ม�ค่*าต*างก�นำ 2 2 ค่*าค่*า

Page 59: AS714 Final Project กลุ่ม 10

ผ� ใช้ เล-อกป'.ม ผ� ใช้ เล-อกป'.ม choose choose ใต ใต classifiersclassifiers

เล-อกป'.ม เล-อกป'.ม classifiersclassifiers เล-อกต นำไม เล-อกต นำไม treestrees

เล-อกข้�+นำตอนำว/ธ์� เล-อกข้�+นำตอนำว/ธ์� Id3Id3

Page 60: AS714 Final Project กลุ่ม 10

ผ� ใช้ ก�าหนำด้เล-อก ผ� ใช้ ก�าหนำด้เล-อก use use training settraining set

เพ-�อใช้ ที่'กต�วอย*างในำการสุร างเพ-�อใช้ ที่'กต�วอย*างในำการสุร างต นำไม ต นำไม ผ� ใช้ เล-อกล�กษณะปประจ�าเป�าผ� ใช้ เล-อกล�กษณะปประจ�าเป�า

หมายที่��ต องการ โด้ยปกต/ล�กษณะหมายที่��ต องการ โด้ยปกต/ล�กษณะประจ�าสุ'ด้ที่ ายจะถู�กเล-อกประจ�าสุ'ด้ที่ ายจะถู�กเล-อก

ผ� ใช้ กด้ป'.ม ผ� ใช้ กด้ป'.ม StartStart เพ-�อเร/�มสุร างเพ-�อเร/�มสุร างต นำไม ต นำไม

Page 61: AS714 Final Project กลุ่ม 10

รายงานำผลล�พธ์�ข้องรายงานำผลล�พธ์�ข้องต�วแบบ ก�บข้ อม�ล ต�วแบบ ก�บข้ อม�ล

trainingtraining

Confusion Confusion matrix matrix แสุด้แสุด้

งค่*าที่��ได้ จากต�วแบบ งค่*าที่��ได้ จากต�วแบบ ((ด้ านำบนำด้ านำบนำ ) ) ก�บค่*าจร/ง ก�บค่*าจร/ง

((ด้ านำล*างด้ านำล*าง ) ) ผลล�พธ์�ที่��ด้�ผลล�พธ์�ที่��ด้�ต องไม*ม�ค่*านำอก ต องไม*ม�ค่*านำอก

diagonaldiagonal

Page 62: AS714 Final Project กลุ่ม 10

แฟั=ม weather.arff

@relation weather

@attribute outlook {sunny, overcast, rainy}

@attribute temperature real

@attribute humidity real

@attribute windy {TRUE, FALSE}

@attribute play {yes, no}

@data

sunny,85,85,FALSE,no

sunny,80,90,TRUE,no

overcast,83,86,FALSE,yes

rainy,70,96,FALSE,yes

rainy,68,80,FALSE,yes

rainy,65,70,TRUE,no

overcast,64,65,TRUE,yes

sunny,72,95,FALSE,no

sunny,69,70,FALSE,yes

rainy,75,80,FALSE,yes

sunny,75,70,TRUE,yes

overcast,72,90,TRUE,yes

overcast,81,75,FALSE,yes

rainy,71,91,TRUE,no

Page 63: AS714 Final Project กลุ่ม 10

การเปิล��ย่นล�กษณะปิระจ(าให�เปิ�นคื�าไม�ตั�อเน��อง

เล�อก Discretize ในกล�อง Filter โดย่เล�อก filter unsupervised attribute

ปิร�บคื�าในกล�อง bins ให�เหมาะสม เช้�นก(าหนดให�เปิ�น 3 กล�อง

กดปิ6Bม OK แล�วกด Apply

Page 64: AS714 Final Project กลุ่ม 10

ผลที่��ได�จากแปิลงเปิ�นคื�าไม�ตั�อเน��อง

Page 65: AS714 Final Project กลุ่ม 10

เล�อก Id3 ในกล�อง Classify ใตั�แถบ Classify โดย่ classifiers trees Id3

เล�อก Use Training set ในกล�อง Test option

กดปิ6Bม Start จะได�ผลล�พัธี3ด�งร'ปิด�านซึ่�าย่

Page 66: AS714 Final Project กลุ่ม 10
Page 67: AS714 Final Project กลุ่ม 10

เล�อก J48 ในกล�อง Classify ใตั�แถบ Classify โดย่ classifiers trees

J48 เราไม�จ(าเปิ�นตั�องเปิล��ย่น

ล�กษณะปิระจ(าให�เปิ�นช้น.ดที่��ม�คื�าไม�ตั�อเน��อง

เล�อก Use Training set ในกล�อง Test option

กดปิ6Bม Start จะได�ผลล�พัธี3ด�งร'ปิด�านซึ่�าย่

Page 68: AS714 Final Project กลุ่ม 10
Page 69: AS714 Final Project กลุ่ม 10

ตั�นไม�การตั�ดส.นใจด�งกล�าวสามารถจ(าแนก play ถ'กตั�อง 100%=== Confusion Matrix ===a b <-- classified as9 0 | a = yes0 5 | b = no

Page 70: AS714 Final Project กลุ่ม 10

ตั�วแบบการที่(าเหม�องข�อม'ลแบบจ(าแนกปิระเภที่ Bayes ใช้�หล�กของเบย่3หร�อตั�วแบบเช้.งคืวามน�าจะเปิ�น Functions ตั�วแบบในร'ปิของฟั5งก3ช้�น Lazy ตั�วแบบที่��การตั�ดส.นใจเก.ดเม��อตั�วอย่�างใหม�ถ'กน(าเข�า Meta ตั�วแบบเมตัา Misc ว.ธี�การสร�างตั�วแบบว.ธี�อ��น Trees ตั�วแบบในร'ปิตั�นไม� Rules ตั�วแบบในร'ปิกฎี

Page 71: AS714 Final Project กลุ่ม 10

เร.�มการที่(างานของซึ่อฟัตั3แวร3 Weka เปิ�ดโมด'ล Explorer เปิ�ดแฟั=ม Weather.nominal.arff แปิลงล�กษณะปิระจ(าที่��ม�คื�าตั�อเน��องเปิ�นล�กษณะปิระจ(าที่��ม�คื�าไม�

ตั�อเน��องโดย่ใช้� Filter ก�อนเล�อกแถบ Classify

Page 72: AS714 Final Project กลุ่ม 10

ผ'�ใช้�เล�อกปิ6Bม choose ใตั� classifiers

เล�อกปิ6Bม classifiers เล�อก bayes เล�อกข�#นตัอนว.ธี�

NaïveBayesSimple

Page 73: AS714 Final Project กลุ่ม 10

ผ� ใช้ ก�าหนำด้เล-อก ผ� ใช้ ก�าหนำด้เล-อก use use training settraining set

เพ-�อใช้ ที่'กต�วอย*างในำการสุร างต�วเพ-�อใช้ ที่'กต�วอย*างในำการสุร างต�วแบบข้องเบย�แบบข้องเบย�ผ� ใช้ เล-อกล�กษณะปประจ�าเป�าผ� ใช้ เล-อกล�กษณะปประจ�าเป�า

หมายที่��ต องการ โด้ยปกต/ล�กษณะหมายที่��ต องการ โด้ยปกต/ล�กษณะประจ�าสุ'ด้ที่ ายจะถู�กเล-อกประจ�าสุ'ด้ที่ ายจะถู�กเล-อก

ผ'�ใช้�กดปิ6Bม Start เพั��อเร.�มสร�างตั�วแบบของเบย่3

Page 74: AS714 Final Project กลุ่ม 10

รายงานำผลล�พธ์�ข้องรายงานำผลล�พธ์�ข้องต�วแบบ ก�บข้ อม�ล ต�วแบบ ก�บข้ อม�ล

trainingtraining

Confusion Confusion matrix matrix แสุด้แสุด้

งค่*าที่��ได้ จากต�วแบบ งค่*าที่��ได้ จากต�วแบบ ((ด้ านำบนำด้ านำบนำ ) ) ก�บค่*าจร/ง ก�บค่*าจร/ง

((ด้ านำล*างด้ านำล*าง ) ) ผลล�พธ์�ที่��ด้�ผลล�พธ์�ที่��ด้�ต องไม*ม�ค่*านำอก ต องไม*ม�ค่*านำอก

diagonaldiagonal

Page 75: AS714 Final Project กลุ่ม 10

ตั�วแบบของเบย่3ที่��ได�สามารถจ(าแนก play ได�ถ'กตั�อง 92.8571% ม�การจ(าแนกผ.ดเพั�ย่ง 1 ตั�วอย่�าง

=== Confusion Matrix ===a b <-- classified as9 0 | a = yes1 4 | b = no

Page 76: AS714 Final Project กลุ่ม 10

สมมตั.ว�าเราพับข�อม'ล (outlook=sunny, temperature=mild,humidity=normal, windy=TRUE)

Pr(X|play=yes)·Pr(play=yes) = Pr(outlook=sunny|play=yes)·Pr(temperature=mild|play=yes)·

Pr(humidity=normal|play=yes)·Pr(windy=TRUE|play=yes)· Pr(play=yes) = 0.25·0.41667·0.63636·0.3636·0.625 = 0.015064Pr(X|play=no)·Pr(play=no) = Pr(outlook=sunny|play=no)·Pr(temperature=mild|play=no)·

Pr(humidity=normal|play=no)·Pr(windy=TRUE|play=no)· Pr(play=no) =0.5·0.375·0.2857·0.5714·0.375 = 0.011478 เราสร6ปิว�า X คืวรเปิ�น yes

Page 77: AS714 Final Project กลุ่ม 10

ในกรณ�คื�าคืวามน�าจะเปิ�นบางช้�วงเปิ�นศึ'นย่3 เราพับว�าหล�กการของเบย่3อาจไม�สามารถเล�อกคื�าของคืลาสเปิ=าหมาย่ที่��ตั�องการได� เพัราะเม��อน(าคืวามน�าจะเปิ�นศึ'นย่3คื'ณด�วย่ตั�วเลขใดๆ ก8จะได�คื�าศึ'นย่3

ว.ธี�การแก�ปิ5ญ่หาใช้� Laplace Estimator กล�าวคื�อ การบวกหน%�งหน�วย่เข�าในที่6กคื�าของตัารางคืวามถ�� ก�อนการปิระมาณคืวามน�าจะเปิ�น

หล�กการด�งกล�าวถ'กใช้�ใน NaiveBayes

Page 78: AS714 Final Project กลุ่ม 10
Page 79: AS714 Final Project กลุ่ม 10

Class yes: P(C) = 0.63outlook: Discrete Estimator. Counts = 3 5 4 (Total = 12)temperature: Discrete Estimator. Counts = 3 5 4 (Total = 12)humidity: Discrete Estimator. Counts = 4 7 (Total = 11)windy: Discrete Estimator. Counts = 4 7 (Total = 11)Class no: P(C) = 0.38outlook: Discrete Estimator. Counts = 4 1 3 (Total = 8)temperature: Discrete Estimator. Counts = 3 3 2 (Total = 8)humidity: Discrete Estimator. Counts = 5 2 (Total = 7)windy: Discrete Estimator. Counts = 4 3 (Total = 7)

=== Confusion Matrix ===a b <-- classified as9 0 | a = yes1 4 | b = no

ตั�วแบบของเบย่3ที่��ได�สามารถจ(าแนก play ถ'กตั�อง 928571. %

Page 80: AS714 Final Project กลุ่ม 10

การที่(าเหม�องข�อม'ลแบบจ(าแนกปิระเภที่ใช้�หล�กของเบย่3 ใข�การสร�างตัารางคืวามถ�� แล�วปิระมาณเปิ�นคืวามน�าจะเปิ�นแบบม�เง��อนไข

NaiveBayesSimple คื�อการใช้�คืวามน�าจะเปิ�นแบบม�เง��อนไข โดย่ที่��สมม6ตั.ว�าล�กษณะปิระจ(าแตั�ละล�กษณะปิระจ(าเปิ�นอ.สระตั�อก�น

NaiveBayes เปิ�นการคื(านวณหาคื�าคืวามน�าจะเปิ�นแบบม�เง��อนไขโดย่ใช้� Laplace estimator (เตั.มหน%�งหน�วย่ในตัารางคืวามถ��)

การก(าหนดคืลาสของตั�วอย่�างจากตั�วแบบ NaiveBayes คื(านวณโดย่หาคื�าคืวามน�าจะเปิ�นของคืลาสที่��มากที่��ส6ด

Page 81: AS714 Final Project กลุ่ม 10

เร.�มการที่(างานของซึ่อฟัตั3แวร3 WEKA เปิ�ดโมด'ล Explorer

เปิ�ดแฟั=ม weather.arff ตั�วแบบเคืร�อข�าย่ปิระสาที่สามารถร�บล�กษณะปิระจ(าที่��ม�คื�า

ตั�อเน��องและคื�าไม�ตั�อเน��องได�เล�อกแถบ Classify

Page 82: AS714 Final Project กลุ่ม 10
Page 83: AS714 Final Project กลุ่ม 10
Page 84: AS714 Final Project กลุ่ม 10
Page 85: AS714 Final Project กลุ่ม 10
Page 86: AS714 Final Project กลุ่ม 10
Page 87: AS714 Final Project กลุ่ม 10
Page 88: AS714 Final Project กลุ่ม 10

o จากผลล�พัธี3ของตั�วแบบเคืร�อข�าย่ปิระสาที่ เราพับว�าผลล�พัธี3ที่��ได�คื�อคื�าถ�วงน(#าหน�ก การใช้�งานผ'�ใช้�ตั�องเปิล��ย่นคื�าของตั�วแปิรน(าเข�าที่�#งหมดเปิ�นจ(านวน แล�วคื(านวณคื�าผลรวมของคื�าถ�วงน(#าหน�กที่��ได�ก�บคื�าของตั�วแปิรน(าเข�า ผ�านฟั5งก3ช้�นขอบแล�ว ส�งตั�อไปิจนถ%ง Output nodeo การคื(านวณด�งกล�าวม�กม�คืวามย่6�งย่าก เพั��อให�ผ'�ใช้�ซึ่อฟัตั3แวร3 WEKA สามารถน(าตั�วแบบไปิใช้�ได� ผ'�ใช้�ตั�องบ�นที่%กตั�วแบบ แล�วใช้�ตั�วแบบก�บแฟั=มตั�วอย่�างก(าหนด

Page 89: AS714 Final Project กลุ่ม 10
Page 90: AS714 Final Project กลุ่ม 10
Page 91: AS714 Final Project กลุ่ม 10

o หล�งจากบ�นที่%กตั�วแบบเคืร�อข�าย่ปิระสาที่ ผ'�ใช้�ตั�องการที่ดสอบโดย่เตัร�ย่มข�อม'ล Test datao ข�#นตัอนในการที่ดสอบข�อม'ล Test data• ใช้�ซึ่อฟัตั3แวร3 WEKA เปิ�ด Test data• เล�อก classify• กดเมาส3ขวาที่��กล�อง Result list เล�อก Load model• เล�อก Supplied test set เปิ�ดแฟั=ม Test data•กดเมาส3ขวา เล�อก Re-evaluate model on current test set

Page 92: AS714 Final Project กลุ่ม 10
Page 93: AS714 Final Project กลุ่ม 10
Page 94: AS714 Final Project กลุ่ม 10
Page 95: AS714 Final Project กลุ่ม 10
Page 96: AS714 Final Project กลุ่ม 10
Page 97: AS714 Final Project กลุ่ม 10

o ผ'�ใช้�สามารถด'ผลล�พัธี3ที่��ที่(านาย่เปิร�ย่บเที่�ย่บก�บคืลาสเปิ=าหมาย่ โดย่ใช้� ArffViewero ล�กษณะปิระจ(าที่��ได�จากการที่(านาย่จะข%#นด�วย่คื(าว�า Predicted แล�วตัามด�วย่ช้��อคืลาสเปิ=าหมาย่ เช้�น คืลาสเปิ=าหมาย่ช้��อ class ได�คืลาสที่(านาย่ช้��อ predictedclass

Page 98: AS714 Final Project กลุ่ม 10

o ข� #นตัอนว.ธี�การที่(าเหม�องข�อม'ลแบบจ(าแนกปิระเภที่โดย่ใช้�เคืร�อข�าย่ปิระสาที่ในซึ่อฟัตั3แวร3 WEKA คื�อ MultiLayerPerceptronoการเร�ย่นร' �ที่��เก.ดข%#นคื�อ การหาคื�าถ�วงน(#าหน�กของเคืร�อข�าย่ปิระสาที่ที่��เช้��อมจาก Input Layer ไปิ Hidden Layer ไปิ Output Layeroปิรกตั.ผลล�พัธี3ที่��ได�ของเคืร�อข�าย่ปิระสาที่จะม�ปิระส.ที่ธี.ภาพัด� ผ'�ใช้�ตั�องม�การเล�อกพัาราม.เตัอร3ที่��เหมาะสม เช้�น Hidden nodes, learning rate, momentum, training time

Page 99: AS714 Final Project กลุ่ม 10
Page 100: AS714 Final Project กลุ่ม 10

New Layout สร�างผ�งการไหลใหม�Save Layout เก8บผ�งที่��สร�างไว�ใน Knowledge Flow Layout บ�นที่%กลง แฟั=มข�อม'ลเพั��อน(ากล�บมาใช้�ใหม�Open Layout เปิ�ดแฟั=มข�อม'ลที่��เก8บผ�งที่��สร�างไว�แล�ว เพั��อน(ากล�บมาใช้�ใหม�Selection เปิล��ย่นเมาส3ให�เปิ�นตั�วช้�# เพั��อเล�อกภาพัส�ญ่ล�กษณ3หร�อเส�นเช้��อมDisplay help แสดงข�อคืวามอธี.บาย่การใช้�เคืร��องม�อของผ�งการไหลของคืวามร' �

Stop all execution หย่6ดการปิระมวลผลที่6กอย่�างที่��เก.ดข%�น

Page 101: AS714 Final Project กลุ่ม 10

oDataSources: ก(าหนดแหล�งข�อม'ลที่��อ�านเข�าผ�งoDataSinks: ก(าหนดการบ�นที่%กข�อม'ลหร�อจ6ดส6ดที่�าย่ของกระบวนการoFilters: ข�#นตัอนการจ�ดการเตัร�ย่มข�อม'ลoClassifiers: การสร�างตั�วแบบและว.ธี�การในการจ�ดจ(าแนดปิระเภที่oClusterers: การใช้�ข� #นตัอนว.ธี�การว.เคืราะห3การเกาะกล6�มoAssociations: การใช้�ข� #นตัอนว.ธี�การหากฎีเช้��อมโย่งoEvaluation: ปิระเม.นและแบ�งเซึ่ตัข�อม'ลออกเปิ�นส�วนๆoVisualization: ส(าหร�บแสดงผลล�พัธี3ด�วย่ภาพันามธีรรม

Page 102: AS714 Final Project กลุ่ม 10

oเร.�มจากเล�อกแถบ DataSourcesoเล�อกส�ญ่ล�กษณ3 ArffLoader เมาส3เปิล��ย่นเปิ�นเคืร��องหมาย่กากบาที่oกดเมาที่3ในบร.เวณ Knowledge Flow Layoutoกดเมาส3ปิ6Bมขาที่�� ArffLoader เล�อก Configureoเล�อกแฟั=มที่��ช้��อ weather.arff

Page 103: AS714 Final Project กลุ่ม 10

oเล�อกแถบ Visualizationoกดเมาที่3ที่�� Text Viewer เมาส3 เปิล��ย่นเปิ�นเคืร��องหมาย่กากบาที่oกดเมาที่3ปิ6Bมขวาเพั��อเช้��อม ArffLoader ไปิย่�ง TextViewer โดย่เล�อก dataset บนเมน'ของ weather.arffoกดเมาที่3ปิ6Bมขวาที่�� ArffLoader โดย่เล�อก Start loading ใตั�ราย่การ Action

Page 104: AS714 Final Project กลุ่ม 10

oหล�งจากเล�อก Start loading ได�ราย่การ Action ของ ArffLoaderoช้��อแฟั=มที่��อ�านจะปิรากฎีใตั�ภาพั ArffLoaderoแสดงข�อคืวามโดย่เล�อก Show results ภาย่ใตั�ราย่การใน TextViewer โดย่กดเมาส3ปิ6Bมขวาoผลล�พัธี3ที่��ได�แสดงที่างภาพัด�านซึ่�าย่

Page 105: AS714 Final Project กลุ่ม 10

oเร.�มจาก DataSources โดย่ใช้� ArffLoaderoเล�อก Configure.. แล�วเล�อกแฟั=ม labor.arffoเล�อกแถบ Filters ที่��เร�ย่ก Replace Missing Values เพั��อเตั.มคื�าที่��หาย่ไปิoเล�อกแถบ Visualization แล�วเล�อก TextViewer เพั��อแสดงผลล�พัธี3

Page 106: AS714 Final Project กลุ่ม 10

oเร.�มจาก DataSources โดย่ใช้� ArffLoaderoเล�อก Configure… แล�วเล�อกแฟั=ม lobor.arffoเล�อกแถบ Filters แล�วเล�อก Discretize เพั��อเปิล��ย่นตั�วแปิรที่��ม�คื�าตั�อเน��องเปิ�นตั�วแปิรที่��ม�คื�าไม�ตั�อเน��องoเล�อก TextViewer จากแถบ Visualization

Page 107: AS714 Final Project กลุ่ม 10

oเร.�มจาก DataSources โดย่ใช้� ArffLoaderoเล�อก Configure… แล�วเล�อกแฟั=ม labor.arffoเล�อกแถบ Filters ที่��เร�ย่ก Nomalize เพั��อแปิลงตั�วแปิรที่��ม�คื�าตั�อเน��องให�อย่'�ในช้�วง [0,1]oเล�อกแถบ Visualization แล�วเล�อก TextViewer เพั��อแสดงผลล�พัธี3

Page 108: AS714 Final Project กลุ่ม 10

oเร.�มจาก DataSources โดย่ใช้� ArffLoaderoเล�อก configure… แล�วเล�อกแฟั=ม labor.arffoเล�อกแถบ Filters ที่��เร�ย่ก Standardize เพั��อแปิลงตั�วแปิรให�ม�คื�าตักอย่'�ในช้�วงของการกระจาย่แบบปิรกตั.มาตัรฐานoเล�อกแถบ Visualization แล�วเล�อก TextViewer เพั��อแสดงผลล�พัธี3

Page 109: AS714 Final Project กลุ่ม 10

oซึ่อฟัตั3แวร3 WEKA สามารถแปิลงข�อม'ลให�อย่'�ในร'ปิแบบ csv เพั��อน(าไปิใช้�ก�บซึ่อฟัตั3แวร3อ��น เช้�น Calcoเร.�มจากเล�อก ArffLoader ใน DataSourcesoแปิลงข�อม'ลให�เหมาะสมoเล�อกแถบ DataSinks แล�วเล�อก CSV saveroเล�อกแฟั=มข�อม'ล Arff ที่��ตั�องการ แล�วเล�อก Start Loading

Page 110: AS714 Final Project กลุ่ม 10

oเล�อก Configure… ในเมน'ของ CSV saveroเปิล��ย่นสถานที่��ที่��ตั�องการเก8บไปิตั(าแหน�งที่��ตั�องการเก8บ โดย่เพั.�ม prefix ให�ก�บช้��อแฟั=มที่��ตั�องการoเก8บข�อม'ลโดย่เล�อก Start loading ใน ArffLoader

Page 111: AS714 Final Project กลุ่ม 10

oก(าหนดข�อม'ลในแฟั=ม iris.arff ให�หาตั�วตั�นไม�การตั�ดส.นใจที่��ด�ที่��ส6ด โดย่ใช้� 5 fold cross-validation ก�บข�#นตัอนว.ธี� J 48 แสดงผลล�พัธี3ที่��ได�ในร'ปิแบบตั�นไม�oแนวที่างวางผ�งการไหล:

DataSource Evaluation J48 Visualization

•เร.�มจากการอ�านแฟั=ม iris.arff•ก(าหนดล�กษณะปิระจ(าที่��ใช้�แที่นคืลาส•แบ�งข�อม'ลออกเปิ�น 5 ส�วนเพั��อที่(า cross-validation•ใช้�ข� #นตัอนว.ธี� J48•แสดงผลล�พัธี3

Page 112: AS714 Final Project กลุ่ม 10

oเล�อก ArffLoader จากแถบ DataSourcesoปิร�บแตั�งให�เล�อกแฟั=ม iris.arff จาก Configure… เมน'oเล�อก Class Assignment จากแถบ Evaluationoเล�อกคืลาสเปิ=าหมาย่

Page 113: AS714 Final Project กลุ่ม 10

oเล�อก Cross Validation FoldMaker จากแถบ Evaluationoปิร�บแตั�งให�ม�จ(านวน fold เที่�าก�บ 5oส�งข�อม'ล DataSet จาก Class Assigner

Page 114: AS714 Final Project กลุ่ม 10

o เล�อก J48 จากแถบ Classifiers

o โย่งข�อม'ลจาก Cross Validation FoldMaker โดย่เล�อก training set และ test set โย่งไปิที่�� J48

o ส��งให�ข�อม'ลน(าเข�า โดย่เล�อก Start loading จาก ArffLoader

Page 115: AS714 Final Project กลุ่ม 10

oเล�อก Classifiers PerformanceEvaluators จากแถบ Evaluationoโย่งข�อม'ลจาก J48 โดย่เล�อก batchClassifiers โย่งไปิที่�� ClassifiersPerformanceEvaluatorsoสร�าง TextViewer และ/หร�อ Graph Viewer จาก Visualization

Page 116: AS714 Final Project กลุ่ม 10

oเล�อก Start Loading จากแถบ ArffLoaderoรอจนจบ แล�วเล�อก Show results จาก TextVieweroผลล�พัธี3ที่��ได�แสดงด�งร'ปิซึ่�าย่ซึ่%�งให�คื�าที่��ถ'กตั�อง 96%oใน Confusion Matrix แสดงผลจากการเปิร�ย่บเที่�ย่บก�บกล6�มที่��สนใจ

Page 117: AS714 Final Project กลุ่ม 10
Page 118: AS714 Final Project กลุ่ม 10

o การออกแบบผ�งการไหลโดย่ปิรกตั. DataSource Filter Classifier/Clusterers/Association Evaluation Visualization DataSinks

o Filter ใช้�ในการเตัร�ย่มข�อม'ลo Classifier/Clusterers/Association ใช้�ในการสร�างตั�วแบบในการที่(าเหม�องข�อม'ลo Evaluation ใช้�ในการเล�อกตั�วแบบo Visualization ใช้�ในการแสดงผลล�พัธี3ของการที่(าเหม�องข�อม'ลo DataSinks ใช้�ในการเก8บผลล�พัธี3