as714 final project กลุ่ม 10
DESCRIPTION
WEKA 3.6.1TRANSCRIPT
Present toPresent to
Dr. Wannapa (Kay) MahamaneeratDr. Wannapa (Kay) Mahamaneerat
ByBy
Group 10 (DTM#2)Group 10 (DTM#2)
• เปิ�ดตั�ว Version แรกของ WEKA คื�อ version 2.1
WEKA ย่�อมาจาก Waikato Environment for Knowledge Analysis
WEKA เปิ�น Software free ที่��สามารถ download ภาย่ใตั� GNU General Public License
เข�ย่นโดย่ใช้�ภาษา Java ที่�#งหมด สร�างข%#นมาโดย่เน�นก�บ การเร�ย่นร' �ด�วย่เคืร��อง (Machine
Learning) ก�บการที่(าเหม�องข�อม'ล ม�โมด'ลย่�อย่ส(าหร�บจ�ดการข�อม'ล ใช้� Graphic User Interface / GUI และคื(าส��งในการ
ส��งให� Software ปิระมวลผล
การพั�ฒนาของ WEKA Version เร.�มตั�น
เปิ�น Non-Java เปิ�น TCL/TK front-end ในการสร�างแบบจ(าลองและที่ฤษฎี�ที่��น(าไปิใช้�ก�บโปิรแกรมภาษาอ��นๆ รวมที่�#งการจ�ดเตัร�ย่มข�อม'ลในภาษา C และ Make file based System ส(าหร�บการ Run Machine Learning Experiments ใช้�ในการว.เคืราะห3ข�อม'ลด�านการเกษตัร
ตั�#งแตั� Version 3 เปิ�น Fully-Java โดย่เร.�มพั�ฒนาในปิ4 1997
ปิ5จจ6บ�นน(าไปิใช้�ปิระโย่ช้น3ในสาขาอ��นๆ ที่�#งด�านการศึ%กษาและว.จ�ย่
สามารถ run บน Hardware และ OS ที่��วๆไปิ เน��องจาก WEKA พั�ฒนามาจาก Java
โปิรแกรม WEKA ตั.ดตั�#งง�าย่ โดย่ สามารถ download ได�ที่�� http://www.cs.waikato.ac.nz/ml/weka/
โปิรแกรมเปิ�นแบบ Self-installer สามารถที่(าตัามข�#นตัอนการตั.ดตั�#งจนเสร8จส.#นการตั.ดตั�#ง
1.เปิ�น Free ware ที่��สามารถ download ได�ภาย่ใตั� GUN (General Public License) และสามารถเข�าถ%ง source code เพั��อน(าไปิพั�ฒนาตั�อย่อดได�2. สามารถใช้�ร�วมก�บโปิรแกรมอ��นๆ ได�ง�าย่ เพัราะเข�ย่นด�วย่ภาษา Java ด�งน�#น จ%งสามารถ Run ได�บนที่6กๆ Platform และม�เคืร��องม�อในการเช้��อมตั�อ SQL Database โดย่ใช้� Java Database connectivity และสามารถส�บคื�นข�อม'ลจาก database query ได�3. สามารถ convert ข�อม'ลผ�าน database link ไปิเปิ�น flat file format ที่��เหมาะสมก�บการ process ใน WEKA
4. ได�รวบรวมช้6ดเคืร��องม�อในการที่(า data preparation และ เที่คืน.คืการสร�าง Model
7. โปิรแกรม WEKA ม�อ�ลกอร.ที่%มที่��ร' �จ�กก�นด�ของการที่(าดาตั�าไมน3น.�งให�เล�อกใช้�อย่�างคืรบถ�วน และสามารถเข�ย่นฟั5งก3ช้�นเพั.�มเข�าไปิในโปิรแกรมเองได�
5. ม�ล�กษณะการใช้�งานง�าย่ เน��องจากม� GUI ที่��ใช้�ส(าหร�บผ'�เร.�มตั�น6. WEKA สามารถร�บม�อก�บข�อม'ลที่��ม�ขนาดใหญ่� ซึ่%�งสามารถว.เคืราะห3บน remote machine หร�อ server หลาย่เคืร��องที่(าพัร�อมๆ ก�น (WEKA Server) Technology น�#เร�ย่ก “Grid WEKA” ซึ่%�งง�าย่ตั�อการ setup และใช้� resource จาก server หลาย่ๆ เคืร��อง ช้.#นงานตั�างๆ จะถ'ก process แย่กอย่'�บน server แตั�ละเคืร��องที่��ม� CPU หลาย่ตั�วในการ processing
Simple CLI (Command Line Interface)
Explorer Experimenter
KnowledgeFlow ArffViewer
Log
โปิรแกรมร�บคื(าส��งการที่(างานผ�านการพั.มพั3
โปิรแกรมที่��ออกแบบในล�กษณะ GUI
โปิรแกรมที่��ออกแบบการที่ดลองและการที่ดสอบผล
โปิรแกรมออกแบบผ�งการไหลของคืวามร' �
โปิรแกรมที่��ใช้�ส(าหร�บแก�ไขแฟั=มปิระเภที่ Arff
โปิรแกรมที่��ใช้�อ�านข�อคืวามบ�นที่%กเก8บระหว�างการที่(างาน
ข�อม'ลข�อม'ล
เล�อก Target table ในร'ปิ
ARFF
ปิระมวลผล Filter ที่��เหมาะสม
เล�อกว.ธี�การ ข�#นตัอนว.ธี�
และพัาราม.เตัอร3
ตั�วแบบตั�วแบบ
แฟั=มข�อม'ลที่��ร �บตั�องอย่'�ในร'ปิแบบ ASCII อาจเปิ�น arff, csv, C45
ในกรณ�แฟั=มข�อม'ลอย่'�ในเคืร�อข�าย่ผ'�ใช้�สามารถเร�ย่กใช้�โดย่อาศึ�ย่ URL
หร�ออาจใช้�ข�อม'ลที่��อย่'�ในฐานข�อม'ลที่��เช้��อมโย่งผ�าน JDBC
ARFF = Attribute-Relation File Format เก8บโดย่ใช้� ASCII
@relation name เปิ�นบรรที่�ดที่��บอกช้��อตัารางข�อม'ลเช้.งส�มพั�นธี3
@attribute att-name type เปิ�นบรรที่�ดที่��บอกช้��อล�กษณะปิระจ(าและช้น.ด numeric หร�อ real หมาย่ถ%งล�กษณะปิระจ(าเก8บเปิ�นตั�วเลข (v1, v2, …, vn) หมาย่ถ%งล�กษณะปิระจ(าเก8บคื�าไม�ตั�อเน��อง
@data เปิ�นบรรที่�ดที่��บอกถ%งแถวที่��ตัามมาจะเปิ�นข�อม'ล แถวละหน%�งระเบ�ย่นเร�ย่งตัามล�กษณะปิระจ(าที่��บอกไว�ข�างตั�น คื��นด�วย่คือมมา
@relation weather
@attribute outlook {sunny, overcast, rainy}
@attribute temperature real
@attribute humidity real
@attribute windy {TRUE, FALSE}
@attribute play {yes, no}
@data
sunny,85,85,FALSE,no
sunny,80,90,TRUE,no
overcast,83,86,FALSE,yes
rainy,70,96,FALSE,yes
rainy,68,80,FALSE,yes
rainy,65,70,TRUE,no
overcast,64,65,TRUE,yes
sunny,72,95,FALSE,no
sunny,69,70,FALSE,yes
rainy,75,80,FALSE,yes
sunny,75,70,TRUE,yes
overcast,72,90,TRUE,yes
overcast,81,75,FALSE,yes
rainy,71,91,TRUE,no
สร6ปิคื�าสถ.ตั.ของล�กษณะปิระจ(าที่��ถ'ก
เล�อกกราฟัหน%�งตั�วแปิร
ของล�กษณะปิระจ(าที่��ถ'กเล�อกไว�
ราย่การของล�กษณะปิระจ(าที่��เล�อกได�
จ(านวนล�กษณะปิระจ(าที่��ม�ที่�#งหมด 5 ตั�วเร�ย่งตัามล(าด�บด�งน�#outlook, temperature, humidity, windy, play
ม�จ(านวนระเบ�ย่นที่�#งหมด 14 ระเบ�ย่น ส(าหร�บล�กษณะปิระจ(า outlook เปิ�นล�กษณะปิระจ(า
ปิระเภที่ Nominal ที่��พั.จารณาไม�ม�ข�อม'ลในระเบ�ย่นที่��ขาดหาย่ไปิ ม�คื�าที่��แตักตั�างก�นที่�#งหมด 3 คื�า ซึ่%�งแตั�ละคื�าไม�ม�เพั�ย่งคื�าเด�ย่วเลย่
คื�าของล�กษณะปิระจ(าคื�อ sunny ม� 5 ระเบ�ย่น overcast ม� 4 ระเบ�ย่น rainy ม� 5 ระเบ�ย่น
ใช้�โปิรแกรมในการสร�าง text file ใดก8ได� เช้�น notepad บรรที่�ดแรกให�ใส� @relation relation_name บรรที่�ดถ�ดมาให�ใส�ล�กษณะปิระจ(าเร�ย่งตัามล(าด�บ
@attribute att_name value ได� @data ข�อม'ลใส�เร�ย่งตัามล(าด�บการปิรากฏของล�กษณะ
ปิระจ(า@data1,2,3,4
ใช้�โปิรแกรมในการสร�าง text file ใดก8ได� เช้�น notepad บรรที่�ดแรกให�ใส� @relation relation_name บรรที่�ดถ�ดมาให�ใส�ล�กษณะปิระจ(าเร�ย่งตัามล(าด�บ
@attribute att_name value ได� @data ข�อม'ลใส�เร�ย่งตัามล(าด�บการปิรากฏของล�กษณะ
ปิระจ(า@data1,2,3,4
ID,SEX,PASS/FAIL,Score,Class
1,M,Pass,45.5,B2,F,Pass,56.78,B3,M,Pass,89,A4,F,Pass,77,A5,M,Fail,32,C6,F,Fail,12,D7,M,Fail,35,C8,F,Pass,62,B9,M,Pass,68,B+10,F,Fail,10,D
สถ.ตั.หน%�งตั�วแปิร (Univariate Statistic) เปิ�นการว.เคืราะห3สถ.ตั.ที่��ใช้�เพั�ย่งหน%�งล�กษณะปิระจ(า = ตั�วแปิร ปิระกอบด�วย่ ช้��อของล�กษณะปิระจ(า ช้น.ดของล�กษณะปิระจ(า ม�เพั�ย่งสองช้น.ดคื�อ Nominal หร�อ
Numeric จ(านวนข�อม'ลที่��ขาดหาย่ไปิเที่�ย่บเปิ�นเปิอร3เซึ่8นตั3ก�บจ(านวนข�อม'ลที่�#งหมด คื�าที่��แตักตั�างก�นที่�#งหมดในล�กษณะปิระจ(า คื�าที่��ม�เพั�ย่งคื�าเด�ย่ว คื.ดเปิ�นเปิอร3เซึ่8นตั3เที่�ย่บก�บคื�าที่�#งหมด
ช้��อล�กษณะปิระจ(า SEX ช้น.ดของคื�าของล�กษณะปิระจ(าเปิ�น
Nominal ในล�กษณะปิระจ(าน�#ไม�ม�คื�าที่��หาย่ไปิ คื�าที่��แตักตั�างก�นม�เพั�ย่งสองคื�าคื�อ M
ก�บ F คื�าที่��เปิ�น M ม�จ(านวน 5 ตั�ว คื�าที่��เปิ�น F ม�จ(านวน 5 ตั�ว คื�าที่��ไม�ซึ่(#าไม�ม�
ช้��อล�กษณะปิระจ(า Score ช้น.ดของคื�าของล�กษณะปิระจ(าเปิ�น Numeric ในล�กษณะปิระจ(าไม�ม�ข�อม'ลที่��ขาดหาย่ไปิ จ(านวนคื�าที่��แตักตั�างก�นที่�#งหมดม� 10 ตั�ว คื�าแตั�ละตั�วม�เพั�ย่งหน%�งเด�ย่ว (ไมม�คื�าที่��ซึ่(#าก�นเลย่)
คื�าตั(�าส6ด Minimum = 10 คื�าส'งส6ด Maximum = 89 คื�าเฉล��ย่เลขคืณ.ตั Mean = 48.728 ส�วนเบ��ย่งเบนมาตัรฐาน StdDev = 26.585
ซึ่อฟัตั3แวร3 WEKA สามารถแสดงกราฟัในม6มมองของแตั�ละล�กษณะปิระจ(าโดย่ใช้�กราฟัแที่�ง โดย่กดที่�� Visualize all
ซึ่อฟัตั3แวร3 Weka แสดงกราฟัระหว�างล�กษณะปิระจ(าสองล�กษณะแถบ Visualize
กราฟัด�งกล�าวเร�ย่กว�า Scatter plot ซึ่%�งแตั�ละจ6ดแสดงระเบ�ย่นหน%�งระเบ�ย่น แตั�ละแกนแที่นคื�าของล�กษณะปิระจ(าแตั�ละคื�า
เราปิร�บขนาดของกราฟัโดย่เปิล��ย่น PlotSize และเปิล��ย่นขนาดของจ6ด โดย่เปิล��ย่น PointSize แล�วกดปิ6Bม Update
ส�ของจ6ดส��อแตั�ละคืลาสที่��ปิรากฎีในข�อม'ล
ซึ่อฟัตั3แวร3 Weka สามารถเล�อกแสดงกราฟัของสองล�กษณะปิระจ(าคื'�ใดๆ
กดปิ6Bม Select Attributes แล�วเล�อกเฉพัาะล�กษณะปิระจ(าที่��ตั�องการพั.จารณา (กด Ctrl
ระหว�างเล�อก) กดปิ6Bม Update
ซึ่อฟัตั3แวร3 Weka คื(านวณหาสมการถดถอย่เช้.งเส�น เฉพัาะล�กษณะปิระจ(าที่��เปิ�นจ(านวน น(าข�อม'ลเข�าซึ่อฟัตั3แวร3 Weka เล�อกแถบ Classify ในกล6�มของโมด'ล Classifier กด Choose เล�อกฟั5งก3ช้�น
(Functions) แล�วเล�อก LinearRegression เปิล��ย่น Test Option ให� Use Training Set เล�อกล�กษณะปิระจ(าใตั�กล�อง Test Option เฉพัาะที่��ม� (Num) ข�าง
หน�า กด Start ผลล�พัธี3จะแสดงในกล�อง Classifier Output
ในกรณ�ที่��ล�กษณะปิระจ(าที่��ตั�องการไม�ใช้�จ(านวน ให�ใช้� Logistic Regression น(าข�อม'ลเข�าซึ่อฟัตั3แวร3 Weka เล�อกแถบ Classify ในกล6�มของโมด'ล Classifier กด Choose เล�อก
ฟั5งก3ช้�น (Functions) แล�วเล�อก Logistic เปิล��ย่น Test Option ให� Use Training Set เล�อกล�กษณะปิระจ(าใตั�กล�อง Test Option เฉพัาะที่��ม�
(Nom) กด Start ผลล�พัธี3จะแสดงในกล�อง Classifier Output
ตั�วกรอง (Filters) รวบรวมโมด'ลในข�#นการเตัร�ย่มข�อม'ล ตั�วกรองแบ�งออกเปิ�นสองล�กษณะ คื�อ
Supervised รวมโมด'ลที่��แปิลงข�อม'ลแบบอ�ตัโนม�ตั.ที่��ม�การคืวบคื6มด�วย่พัาราม.เตัอร3ที่�ผ'�ใช้�ก(าหนด แบ�งเปิ�นสองหมวดใหญ่�คื�อ ล�กษณะปิระจ(า (attribute) ก�บข�อม'ลแตั�ละระเบ�ย่น (instance)
Unsupervised รวมโมด'ลที่��แปิลงข�อม'ลที่��ผ'�ก(าหนดเอง แบ�งเปิ�นสองหมวดใหญ่�คื�อ ล�กษณะปิระจ(า (attribute) ก�บข�อม'ลแตั�ละระเบ�ย่น (instance)
ล�กษณะปิระจ(า (Attribute) AttributeSelection
ตั�วกรองที่��เล�อกล�กษณะปิระจ(าที่��น(ามาว.เคืราะห3แบบอ�ตัโนม�ตั. โดย่ผ'�ใช้�ก(าหนดตั�วปิระเม.นในกล�อง evaluator และว.ธี�การคื�นในกล�อง search
ClassOrder ตั�วกรองเร�ย่งล(าด�บคืลาส โดย่ผ'�ใช้�ก(าหนดการเร�ย่งในกล�อง
classOrder และ seed Discretize
ตั�วกรองแปิลงคื�าตั�อเน��องให�ไปิเปิ�นคื�าที่��ไม�ตั�อเน��อง โดย่ผ'�ใช้�เล�อกล�กษณะปิระจ(าที่��ตั�องการเปิล��ย่นในกล�อง attributeIndicates และผ'�ใช้�ก(าหนดตั�วเล�อก
NorminalToBinary ตั�วกรองแปิลงคื�า Nominal ให�เปิ�นคื�า Binary โดย่ผ'�ใช้�ก(าหนดคื�าตั�ว
เล�อก
ล�กษณะระเบ�ย่น (Instance) Resample
ตั�วกรองที่��ใช้�ส6�มเล�อกตั�วอย่�าง โดย่ม�การส6�มแบบแที่นคื�ากล�บคื�น โดย่ผ'�ใช้�ก(าหนดคื�าจ(านวนตั�วอย่�างในกล�อง sampleSizePercent
SpreadSubsample ตั�วกรองที่��ใช้�ส6�มเล�อกตั�วอย่�างที่�ม�การก(าหนดส�ดส�วนการกระจาย่ โดย่ผ'�
ใช้�ก(าหนดคื�าการกระจาย่ในกล�อง distributionSpread StratifiedRemoveFolds
ตั�วกรองที่��ใช้�ส6�มเล�อกกล6�มตั�วอย่�างออกเปิ�นช้6ด fold โดย่ผ'�ใช้�ก(าหนดตั�วเล�อก
ล�กษณะปิระจ(า (Attribute) Add AddCluster AddExpression AddID AddNoise AddValues Center ChangeDateFormat ClassAssigner ClusterMembership Copy Discretize
(unsupervised) EMImputation FirstOrder InterquartileRange
ล�กษณะปิระจ(า (Attribute) KernelFilter MakeIndicator MathExpression MergeTwoValues MultiInstanceToProposit
ional NominalToBinary
(unsupervised) NominalToString Normalize (attribute) NumericCleaner NumericToBinary NumericToNominal NumericTransform Obfuscate PartitionedMultiFilter PKIDiscretize PrincipalComponents
(filter)
ล�กษณะปิระจ(า (Attribute) PropositionalToMul
tiInstance RandomProjection RandomSubset RELAGGS Remove RemoveType RemoveUseless Reorder ReplaceMissingVal
ues SortLabels Standardize StringToNominal StringToWordVecto
r SwapValues TimeSeriesDelta TimeSeriesTranslat
e Wavelet
แสดงคืวามส�มพั�นธี3ของเหตั6การณ3หร�อว�ตัถ6 ที่��เก.ดข%#นพัร�อมก�น
ใช้�ก�บ Market Basket Analysis กฏบ�งบอกพัฤตั.กรรมการซึ่�#อของล'กคื�า โดย่ที่��วไปิใช้�ก�บฐานข�อม'ลเช้.งส�มพั�นธี3ที่��บ�นที่%กเปิ�น
Transaction โดย่ที่��แตั�ละระเบ�ย่นคื�อการซึ่�#อส.นคื�าในหน%�งคืร�#ง
ผลล�พัธี3ที่��ตั�องการได�คื�อ กฏแสดงคืวามส�มพั�นธี3ของการซึ่�#อส.นคื�าตั�างช้น.ดก�นโดย่ไม�ข%#นอย่'�ก�บล'กคื�าคืนใดคืนหน%�ง
การเตร�ยมแฟ้�มข้ อม�ล ล�กษณะปิระจ(าของส.นคื�าคื�อช้��อส.นคื�าที่��พั.จารณา ล�กษณะปิระจ(าตั�วแรกคื�อรห�สการซึ่�#อส.นคื�า TID ที่��ไม�น(ามา
ใช้�ในการว.เคืราะห3 ใช้�เพั��อการเช้��อมโย่งกล�บไปิย่�งฐานข�อม'ลเร.�มตั�นเที่�าน�#น
คื�าในล�กษณะปิระจ(าเปิ�น Boolean เช้�นก(าหนดคื�าที่��เปิ�นไปิได�คื�อ y แที่นการใช้�ตั�วเลข 1
ตั�วอย่�าง การซึ่�#อ T100,I1,I2 เข�ย่นเปิ�น T100, 1, 1, ?, ?, ?
ในซึ่อฟัตั3แวร3 Weka ส�ญ่ล�กษณ3 ? แที่นคื�าที่��หาย่ไปิ (missing value)
ข้ อม�ลที่��นำ�ามาใช้
o ปิร�บคื�า min support ในกล�อง lowerBoundMinSuport เช้�น 0.2 (หมาย่ถ%งคื�าสน�บสน6นตั(�าส6ด 20%)oปิร�บคื�า min confidence ในกล�อง minMetric โดย่ metricType เปิ�น Confidence เช้�น 0.5 (หมาย่ถ%งคื�าคืวามเช้��อม��นตั(�าส6ด 50%)o ปิร�บจ(านวนกฎีที่��แสดงผลในกล�อง numRules เช้�น 100
ตั�วแบบ
คืวามหมาย่ของกฎีที่�� 1:การซึ่�#อส.นคื�าของล'กคื�าที่��ม�ส.นคื�า I5 แล�วจะม�ส.นคื�า I1 เสมอ
คืวามหมาย่ของกฎีที่�� 2:การซึ่�#อส.นคื�าของล'กคื�าที่��ม�ส.นคื�า I4 แล�วจะม�ส.นคื�า I2 เสมอ
การที่(าเหม�องข�อม'ลแบบกฎีเช้��อมโย่งสามารถน(าไปิใช้�ก�บข�อม'ลที่��ไม�ใช้� transaction ได� โดย่ใช้�การเข�ารห�สของล�กษณะปิระจ(าเปิ�นช้น.ด Nominal หร�อ Ordinal
ซึ่อฟัตั3แวร3 Weka ใช้�การเข�ารห�ส dummy coding คื�อซึ่อฟัตั3แวร3จะแปิลงคื�าของ Nominal หร�อ Ordinal หน%�งคื�าแที่นด�วย่ตั�วแปิรที่ว.ภาคื เช้�น
ล�กษณะปิระจ(า outlook ม�คื�าที่��เปิ�นไปิได�คื�อ overcast, sunny, rainy แล�วตั�วแปิรที่ว.ภาคืเข�ย่นได�เปิ�น outlook = overcast, outlook = sunny, outlook = rainy
ผลล�พธ์�ที่��ได้ จาก weather.nominal.arff
คืวามหมาย่ของกฎีที่�� 1:ถ�าสภาพัอากาศึเปิ�น overcast แล�ว play = yes เสมอ
คืวามหมาย่ของกฎีที่�� 2:ถ�าอ6ณหภ'ม.เปิ�น cool แล�วคืวามช้�#นจะปิรกตั. (narmal) เสมอ
คืวามหมาย่ของกฎีที่�� 3:ถ�าคืวามช้�#นปิรกตั.และไม�ม�ลม windy = FALSE แล�ว play = yes เสมอ
แฟั=มข�อม'ลที่��ถ'กน(ามาใช้�ในการว.เคืราะห3ตั�องปิระกอบด�วย่ล�กษณะปิระจ(าที่��เปิ�น Nominal หร�อ Ordinal เที่�าน�#น
ข�อม'ลในล�กษณะ transaction เปิ�นข�อม'ล Nominal และการไม�ซึ่�#อใช้�? (missing value) แที่น
TID, atri_1, attri_2,…, attri_n เม��อ TID แที่นรห�สการซึ่�#อและแตั�ละ attri_i ม�คื�า y
หร�อ ? เล�อก Associate และใช้� Apriori ใตั� Associator ปิร�บคื�าพัาราม.เตัอร3 min support ก�บ min
confidence และ numRules ที่��ตั�องการแล�วส��งให�ปิระมวลผล
เปิ�นการสร�างตั�วแบบ Classification ที่��สามารถแบ�งแย่กข�อม'ล ออกตัามล�กษณะเปิ=าหมาย่ที่��ก(าหนด เพั��อระบ6ปิระเภที่ของข�อม'ล
ตั�วแบบที่��ตั�องการอาจเปิ�น Bayes ตั�วแบบเช้.งคืวามน�าจะเปิ�น Functions ตั�วแบบในร'ปิของฟั5งก3ช้�น Lazy ตั�วแบบที่��เก8บตั�วอย่�าง การตั�ดส.นใจเก.ดเม��อตั�วอย่�าง
ใหม�ถ'กน(าเข�าเที่�าน�#น Meta การที่(าตั�วแบบให�ด�ข%#น โดย่การเร�ย่นร' �ข�อม'ลเมตัา Misc ว.ธี�การสร�างตั�วแบบว.ธี�อ��น Trees ว.ธี�การสร�างตั�วแบบโดย่ใช้�ตั�นไม� Rules ว.ธี�การสร�างตั�วแบบโดย่ใช้�กฏ
ล�กษณะประจ�าเป�าหมายล�กษณะประจ�าเป�าหมายเป%นำล�กษณะประจ�าสุ'ด้ที่ ายเป%นำล�กษณะประจ�าสุ'ด้ที่ าย
ในำตารางในำตาราง
ต�วอย*างม�ที่�+งหมด้ ต�วอย*างม�ที่�+งหมด้ 14 14 ต�วอย*าง และม�ล�กษณะต�วอย*าง และม�ล�กษณะประจ�าที่��ไม*ใช้*ล�กษณะประจ�าที่��ไม*ใช้*ล�กษณะประจ�าเป�าหมาย ประจ�าเป�าหมาย 4 4 ต�วต�ว
ก(าหนดล�กษณะปิระจ(าเปิ=าหมาย่ให�เปิ�นล�กษณะปิระจ(าส6ดที่�าย่
เล�อกว.ธี�การสร�างตั�วแบบโดย่ใช้�ตั�นไม� ด�งน�#นตั�องเปิล��ย่นล�กษณะปิระจ(าที่��ม�คื�าตั�อเน��องให�เปิ�นล�กษณะปิระจ(าที่��ม�คื�าไม�ตั�อเน��อง
กรณ�ที่��ม�ระเบ�ย่นน�อย่ อาจใช้� k-fold cross validation หร�อ leave-one-out
กรณ�ที่��ม�ระเบ�ย่นมาก คืวรแบ�งก�#นระเบ�ย่นบางส�วนเปิ�น validation, test data และที่��เหล�อน(ามาใช้�เปิ�น training data ส�ดส�วนที่��ใช้�อาจเปิ�น 3/10 ก�บ 4/10
เร.�มการที่(างานของ WEKA โดย่เปิ�ด โมด'ล Explorer เปิ�ดแฟั=ม weather.nominal.arff แปิลงล�กษณะปิระจ(าที่��ม�คื�าตั�อเน��องเปิ�น
ล�กษณะปิระจ(าที่��ม�คื�าไม�ตั�อเน��องโดย่ใช้� filter ก�อนเล�อกแถบ Classify
OutlookOutlook ม�ค่*าม�ค่*าต*างก�นำ ต*างก�นำ 3 3 ค่*าค่*า
temperaturetemperature ม�ค่*าต*างก�นำ ม�ค่*าต*างก�นำ 3 3 ค่*าค่*า
humidityhumidity ม�ค่*าม�ค่*าต*างก�นำ ต*างก�นำ 2 2 ค่*าค่*า
windywindy ม�ค่*าต*างก�นำ ม�ค่*าต*างก�นำ 2 2 ค่*าค่*า
ผ� ใช้ เล-อกป'.ม ผ� ใช้ เล-อกป'.ม choose choose ใต ใต classifiersclassifiers
เล-อกป'.ม เล-อกป'.ม classifiersclassifiers เล-อกต นำไม เล-อกต นำไม treestrees
เล-อกข้�+นำตอนำว/ธ์� เล-อกข้�+นำตอนำว/ธ์� Id3Id3
ผ� ใช้ ก�าหนำด้เล-อก ผ� ใช้ ก�าหนำด้เล-อก use use training settraining set
เพ-�อใช้ ที่'กต�วอย*างในำการสุร างเพ-�อใช้ ที่'กต�วอย*างในำการสุร างต นำไม ต นำไม ผ� ใช้ เล-อกล�กษณะปประจ�าเป�าผ� ใช้ เล-อกล�กษณะปประจ�าเป�า
หมายที่��ต องการ โด้ยปกต/ล�กษณะหมายที่��ต องการ โด้ยปกต/ล�กษณะประจ�าสุ'ด้ที่ ายจะถู�กเล-อกประจ�าสุ'ด้ที่ ายจะถู�กเล-อก
ผ� ใช้ กด้ป'.ม ผ� ใช้ กด้ป'.ม StartStart เพ-�อเร/�มสุร างเพ-�อเร/�มสุร างต นำไม ต นำไม
รายงานำผลล�พธ์�ข้องรายงานำผลล�พธ์�ข้องต�วแบบ ก�บข้ อม�ล ต�วแบบ ก�บข้ อม�ล
trainingtraining
Confusion Confusion matrix matrix แสุด้แสุด้
งค่*าที่��ได้ จากต�วแบบ งค่*าที่��ได้ จากต�วแบบ ((ด้ านำบนำด้ านำบนำ ) ) ก�บค่*าจร/ง ก�บค่*าจร/ง
((ด้ านำล*างด้ านำล*าง ) ) ผลล�พธ์�ที่��ด้�ผลล�พธ์�ที่��ด้�ต องไม*ม�ค่*านำอก ต องไม*ม�ค่*านำอก
diagonaldiagonal
แฟั=ม weather.arff
@relation weather
@attribute outlook {sunny, overcast, rainy}
@attribute temperature real
@attribute humidity real
@attribute windy {TRUE, FALSE}
@attribute play {yes, no}
@data
sunny,85,85,FALSE,no
sunny,80,90,TRUE,no
overcast,83,86,FALSE,yes
rainy,70,96,FALSE,yes
rainy,68,80,FALSE,yes
rainy,65,70,TRUE,no
overcast,64,65,TRUE,yes
sunny,72,95,FALSE,no
sunny,69,70,FALSE,yes
rainy,75,80,FALSE,yes
sunny,75,70,TRUE,yes
overcast,72,90,TRUE,yes
overcast,81,75,FALSE,yes
rainy,71,91,TRUE,no
การเปิล��ย่นล�กษณะปิระจ(าให�เปิ�นคื�าไม�ตั�อเน��อง
เล�อก Discretize ในกล�อง Filter โดย่เล�อก filter unsupervised attribute
ปิร�บคื�าในกล�อง bins ให�เหมาะสม เช้�นก(าหนดให�เปิ�น 3 กล�อง
กดปิ6Bม OK แล�วกด Apply
ผลที่��ได�จากแปิลงเปิ�นคื�าไม�ตั�อเน��อง
เล�อก Id3 ในกล�อง Classify ใตั�แถบ Classify โดย่ classifiers trees Id3
เล�อก Use Training set ในกล�อง Test option
กดปิ6Bม Start จะได�ผลล�พัธี3ด�งร'ปิด�านซึ่�าย่
เล�อก J48 ในกล�อง Classify ใตั�แถบ Classify โดย่ classifiers trees
J48 เราไม�จ(าเปิ�นตั�องเปิล��ย่น
ล�กษณะปิระจ(าให�เปิ�นช้น.ดที่��ม�คื�าไม�ตั�อเน��อง
เล�อก Use Training set ในกล�อง Test option
กดปิ6Bม Start จะได�ผลล�พัธี3ด�งร'ปิด�านซึ่�าย่
ตั�นไม�การตั�ดส.นใจด�งกล�าวสามารถจ(าแนก play ถ'กตั�อง 100%=== Confusion Matrix ===a b <-- classified as9 0 | a = yes0 5 | b = no
ตั�วแบบการที่(าเหม�องข�อม'ลแบบจ(าแนกปิระเภที่ Bayes ใช้�หล�กของเบย่3หร�อตั�วแบบเช้.งคืวามน�าจะเปิ�น Functions ตั�วแบบในร'ปิของฟั5งก3ช้�น Lazy ตั�วแบบที่��การตั�ดส.นใจเก.ดเม��อตั�วอย่�างใหม�ถ'กน(าเข�า Meta ตั�วแบบเมตัา Misc ว.ธี�การสร�างตั�วแบบว.ธี�อ��น Trees ตั�วแบบในร'ปิตั�นไม� Rules ตั�วแบบในร'ปิกฎี
เร.�มการที่(างานของซึ่อฟัตั3แวร3 Weka เปิ�ดโมด'ล Explorer เปิ�ดแฟั=ม Weather.nominal.arff แปิลงล�กษณะปิระจ(าที่��ม�คื�าตั�อเน��องเปิ�นล�กษณะปิระจ(าที่��ม�คื�าไม�
ตั�อเน��องโดย่ใช้� Filter ก�อนเล�อกแถบ Classify
ผ'�ใช้�เล�อกปิ6Bม choose ใตั� classifiers
เล�อกปิ6Bม classifiers เล�อก bayes เล�อกข�#นตัอนว.ธี�
NaïveBayesSimple
ผ� ใช้ ก�าหนำด้เล-อก ผ� ใช้ ก�าหนำด้เล-อก use use training settraining set
เพ-�อใช้ ที่'กต�วอย*างในำการสุร างต�วเพ-�อใช้ ที่'กต�วอย*างในำการสุร างต�วแบบข้องเบย�แบบข้องเบย�ผ� ใช้ เล-อกล�กษณะปประจ�าเป�าผ� ใช้ เล-อกล�กษณะปประจ�าเป�า
หมายที่��ต องการ โด้ยปกต/ล�กษณะหมายที่��ต องการ โด้ยปกต/ล�กษณะประจ�าสุ'ด้ที่ ายจะถู�กเล-อกประจ�าสุ'ด้ที่ ายจะถู�กเล-อก
ผ'�ใช้�กดปิ6Bม Start เพั��อเร.�มสร�างตั�วแบบของเบย่3
รายงานำผลล�พธ์�ข้องรายงานำผลล�พธ์�ข้องต�วแบบ ก�บข้ อม�ล ต�วแบบ ก�บข้ อม�ล
trainingtraining
Confusion Confusion matrix matrix แสุด้แสุด้
งค่*าที่��ได้ จากต�วแบบ งค่*าที่��ได้ จากต�วแบบ ((ด้ านำบนำด้ านำบนำ ) ) ก�บค่*าจร/ง ก�บค่*าจร/ง
((ด้ านำล*างด้ านำล*าง ) ) ผลล�พธ์�ที่��ด้�ผลล�พธ์�ที่��ด้�ต องไม*ม�ค่*านำอก ต องไม*ม�ค่*านำอก
diagonaldiagonal
ตั�วแบบของเบย่3ที่��ได�สามารถจ(าแนก play ได�ถ'กตั�อง 92.8571% ม�การจ(าแนกผ.ดเพั�ย่ง 1 ตั�วอย่�าง
=== Confusion Matrix ===a b <-- classified as9 0 | a = yes1 4 | b = no
สมมตั.ว�าเราพับข�อม'ล (outlook=sunny, temperature=mild,humidity=normal, windy=TRUE)
Pr(X|play=yes)·Pr(play=yes) = Pr(outlook=sunny|play=yes)·Pr(temperature=mild|play=yes)·
Pr(humidity=normal|play=yes)·Pr(windy=TRUE|play=yes)· Pr(play=yes) = 0.25·0.41667·0.63636·0.3636·0.625 = 0.015064Pr(X|play=no)·Pr(play=no) = Pr(outlook=sunny|play=no)·Pr(temperature=mild|play=no)·
Pr(humidity=normal|play=no)·Pr(windy=TRUE|play=no)· Pr(play=no) =0.5·0.375·0.2857·0.5714·0.375 = 0.011478 เราสร6ปิว�า X คืวรเปิ�น yes
ในกรณ�คื�าคืวามน�าจะเปิ�นบางช้�วงเปิ�นศึ'นย่3 เราพับว�าหล�กการของเบย่3อาจไม�สามารถเล�อกคื�าของคืลาสเปิ=าหมาย่ที่��ตั�องการได� เพัราะเม��อน(าคืวามน�าจะเปิ�นศึ'นย่3คื'ณด�วย่ตั�วเลขใดๆ ก8จะได�คื�าศึ'นย่3
ว.ธี�การแก�ปิ5ญ่หาใช้� Laplace Estimator กล�าวคื�อ การบวกหน%�งหน�วย่เข�าในที่6กคื�าของตัารางคืวามถ�� ก�อนการปิระมาณคืวามน�าจะเปิ�น
หล�กการด�งกล�าวถ'กใช้�ใน NaiveBayes
Class yes: P(C) = 0.63outlook: Discrete Estimator. Counts = 3 5 4 (Total = 12)temperature: Discrete Estimator. Counts = 3 5 4 (Total = 12)humidity: Discrete Estimator. Counts = 4 7 (Total = 11)windy: Discrete Estimator. Counts = 4 7 (Total = 11)Class no: P(C) = 0.38outlook: Discrete Estimator. Counts = 4 1 3 (Total = 8)temperature: Discrete Estimator. Counts = 3 3 2 (Total = 8)humidity: Discrete Estimator. Counts = 5 2 (Total = 7)windy: Discrete Estimator. Counts = 4 3 (Total = 7)
=== Confusion Matrix ===a b <-- classified as9 0 | a = yes1 4 | b = no
ตั�วแบบของเบย่3ที่��ได�สามารถจ(าแนก play ถ'กตั�อง 928571. %
การที่(าเหม�องข�อม'ลแบบจ(าแนกปิระเภที่ใช้�หล�กของเบย่3 ใข�การสร�างตัารางคืวามถ�� แล�วปิระมาณเปิ�นคืวามน�าจะเปิ�นแบบม�เง��อนไข
NaiveBayesSimple คื�อการใช้�คืวามน�าจะเปิ�นแบบม�เง��อนไข โดย่ที่��สมม6ตั.ว�าล�กษณะปิระจ(าแตั�ละล�กษณะปิระจ(าเปิ�นอ.สระตั�อก�น
NaiveBayes เปิ�นการคื(านวณหาคื�าคืวามน�าจะเปิ�นแบบม�เง��อนไขโดย่ใช้� Laplace estimator (เตั.มหน%�งหน�วย่ในตัารางคืวามถ��)
การก(าหนดคืลาสของตั�วอย่�างจากตั�วแบบ NaiveBayes คื(านวณโดย่หาคื�าคืวามน�าจะเปิ�นของคืลาสที่��มากที่��ส6ด
เร.�มการที่(างานของซึ่อฟัตั3แวร3 WEKA เปิ�ดโมด'ล Explorer
เปิ�ดแฟั=ม weather.arff ตั�วแบบเคืร�อข�าย่ปิระสาที่สามารถร�บล�กษณะปิระจ(าที่��ม�คื�า
ตั�อเน��องและคื�าไม�ตั�อเน��องได�เล�อกแถบ Classify
o จากผลล�พัธี3ของตั�วแบบเคืร�อข�าย่ปิระสาที่ เราพับว�าผลล�พัธี3ที่��ได�คื�อคื�าถ�วงน(#าหน�ก การใช้�งานผ'�ใช้�ตั�องเปิล��ย่นคื�าของตั�วแปิรน(าเข�าที่�#งหมดเปิ�นจ(านวน แล�วคื(านวณคื�าผลรวมของคื�าถ�วงน(#าหน�กที่��ได�ก�บคื�าของตั�วแปิรน(าเข�า ผ�านฟั5งก3ช้�นขอบแล�ว ส�งตั�อไปิจนถ%ง Output nodeo การคื(านวณด�งกล�าวม�กม�คืวามย่6�งย่าก เพั��อให�ผ'�ใช้�ซึ่อฟัตั3แวร3 WEKA สามารถน(าตั�วแบบไปิใช้�ได� ผ'�ใช้�ตั�องบ�นที่%กตั�วแบบ แล�วใช้�ตั�วแบบก�บแฟั=มตั�วอย่�างก(าหนด
o หล�งจากบ�นที่%กตั�วแบบเคืร�อข�าย่ปิระสาที่ ผ'�ใช้�ตั�องการที่ดสอบโดย่เตัร�ย่มข�อม'ล Test datao ข�#นตัอนในการที่ดสอบข�อม'ล Test data• ใช้�ซึ่อฟัตั3แวร3 WEKA เปิ�ด Test data• เล�อก classify• กดเมาส3ขวาที่��กล�อง Result list เล�อก Load model• เล�อก Supplied test set เปิ�ดแฟั=ม Test data•กดเมาส3ขวา เล�อก Re-evaluate model on current test set
o ผ'�ใช้�สามารถด'ผลล�พัธี3ที่��ที่(านาย่เปิร�ย่บเที่�ย่บก�บคืลาสเปิ=าหมาย่ โดย่ใช้� ArffViewero ล�กษณะปิระจ(าที่��ได�จากการที่(านาย่จะข%#นด�วย่คื(าว�า Predicted แล�วตัามด�วย่ช้��อคืลาสเปิ=าหมาย่ เช้�น คืลาสเปิ=าหมาย่ช้��อ class ได�คืลาสที่(านาย่ช้��อ predictedclass
o ข� #นตัอนว.ธี�การที่(าเหม�องข�อม'ลแบบจ(าแนกปิระเภที่โดย่ใช้�เคืร�อข�าย่ปิระสาที่ในซึ่อฟัตั3แวร3 WEKA คื�อ MultiLayerPerceptronoการเร�ย่นร' �ที่��เก.ดข%#นคื�อ การหาคื�าถ�วงน(#าหน�กของเคืร�อข�าย่ปิระสาที่ที่��เช้��อมจาก Input Layer ไปิ Hidden Layer ไปิ Output Layeroปิรกตั.ผลล�พัธี3ที่��ได�ของเคืร�อข�าย่ปิระสาที่จะม�ปิระส.ที่ธี.ภาพัด� ผ'�ใช้�ตั�องม�การเล�อกพัาราม.เตัอร3ที่��เหมาะสม เช้�น Hidden nodes, learning rate, momentum, training time
New Layout สร�างผ�งการไหลใหม�Save Layout เก8บผ�งที่��สร�างไว�ใน Knowledge Flow Layout บ�นที่%กลง แฟั=มข�อม'ลเพั��อน(ากล�บมาใช้�ใหม�Open Layout เปิ�ดแฟั=มข�อม'ลที่��เก8บผ�งที่��สร�างไว�แล�ว เพั��อน(ากล�บมาใช้�ใหม�Selection เปิล��ย่นเมาส3ให�เปิ�นตั�วช้�# เพั��อเล�อกภาพัส�ญ่ล�กษณ3หร�อเส�นเช้��อมDisplay help แสดงข�อคืวามอธี.บาย่การใช้�เคืร��องม�อของผ�งการไหลของคืวามร' �
Stop all execution หย่6ดการปิระมวลผลที่6กอย่�างที่��เก.ดข%�น
oDataSources: ก(าหนดแหล�งข�อม'ลที่��อ�านเข�าผ�งoDataSinks: ก(าหนดการบ�นที่%กข�อม'ลหร�อจ6ดส6ดที่�าย่ของกระบวนการoFilters: ข�#นตัอนการจ�ดการเตัร�ย่มข�อม'ลoClassifiers: การสร�างตั�วแบบและว.ธี�การในการจ�ดจ(าแนดปิระเภที่oClusterers: การใช้�ข� #นตัอนว.ธี�การว.เคืราะห3การเกาะกล6�มoAssociations: การใช้�ข� #นตัอนว.ธี�การหากฎีเช้��อมโย่งoEvaluation: ปิระเม.นและแบ�งเซึ่ตัข�อม'ลออกเปิ�นส�วนๆoVisualization: ส(าหร�บแสดงผลล�พัธี3ด�วย่ภาพันามธีรรม
oเร.�มจากเล�อกแถบ DataSourcesoเล�อกส�ญ่ล�กษณ3 ArffLoader เมาส3เปิล��ย่นเปิ�นเคืร��องหมาย่กากบาที่oกดเมาที่3ในบร.เวณ Knowledge Flow Layoutoกดเมาส3ปิ6Bมขาที่�� ArffLoader เล�อก Configureoเล�อกแฟั=มที่��ช้��อ weather.arff
oเล�อกแถบ Visualizationoกดเมาที่3ที่�� Text Viewer เมาส3 เปิล��ย่นเปิ�นเคืร��องหมาย่กากบาที่oกดเมาที่3ปิ6Bมขวาเพั��อเช้��อม ArffLoader ไปิย่�ง TextViewer โดย่เล�อก dataset บนเมน'ของ weather.arffoกดเมาที่3ปิ6Bมขวาที่�� ArffLoader โดย่เล�อก Start loading ใตั�ราย่การ Action
oหล�งจากเล�อก Start loading ได�ราย่การ Action ของ ArffLoaderoช้��อแฟั=มที่��อ�านจะปิรากฎีใตั�ภาพั ArffLoaderoแสดงข�อคืวามโดย่เล�อก Show results ภาย่ใตั�ราย่การใน TextViewer โดย่กดเมาส3ปิ6Bมขวาoผลล�พัธี3ที่��ได�แสดงที่างภาพัด�านซึ่�าย่
oเร.�มจาก DataSources โดย่ใช้� ArffLoaderoเล�อก Configure.. แล�วเล�อกแฟั=ม labor.arffoเล�อกแถบ Filters ที่��เร�ย่ก Replace Missing Values เพั��อเตั.มคื�าที่��หาย่ไปิoเล�อกแถบ Visualization แล�วเล�อก TextViewer เพั��อแสดงผลล�พัธี3
oเร.�มจาก DataSources โดย่ใช้� ArffLoaderoเล�อก Configure… แล�วเล�อกแฟั=ม lobor.arffoเล�อกแถบ Filters แล�วเล�อก Discretize เพั��อเปิล��ย่นตั�วแปิรที่��ม�คื�าตั�อเน��องเปิ�นตั�วแปิรที่��ม�คื�าไม�ตั�อเน��องoเล�อก TextViewer จากแถบ Visualization
oเร.�มจาก DataSources โดย่ใช้� ArffLoaderoเล�อก Configure… แล�วเล�อกแฟั=ม labor.arffoเล�อกแถบ Filters ที่��เร�ย่ก Nomalize เพั��อแปิลงตั�วแปิรที่��ม�คื�าตั�อเน��องให�อย่'�ในช้�วง [0,1]oเล�อกแถบ Visualization แล�วเล�อก TextViewer เพั��อแสดงผลล�พัธี3
oเร.�มจาก DataSources โดย่ใช้� ArffLoaderoเล�อก configure… แล�วเล�อกแฟั=ม labor.arffoเล�อกแถบ Filters ที่��เร�ย่ก Standardize เพั��อแปิลงตั�วแปิรให�ม�คื�าตักอย่'�ในช้�วงของการกระจาย่แบบปิรกตั.มาตัรฐานoเล�อกแถบ Visualization แล�วเล�อก TextViewer เพั��อแสดงผลล�พัธี3
oซึ่อฟัตั3แวร3 WEKA สามารถแปิลงข�อม'ลให�อย่'�ในร'ปิแบบ csv เพั��อน(าไปิใช้�ก�บซึ่อฟัตั3แวร3อ��น เช้�น Calcoเร.�มจากเล�อก ArffLoader ใน DataSourcesoแปิลงข�อม'ลให�เหมาะสมoเล�อกแถบ DataSinks แล�วเล�อก CSV saveroเล�อกแฟั=มข�อม'ล Arff ที่��ตั�องการ แล�วเล�อก Start Loading
oเล�อก Configure… ในเมน'ของ CSV saveroเปิล��ย่นสถานที่��ที่��ตั�องการเก8บไปิตั(าแหน�งที่��ตั�องการเก8บ โดย่เพั.�ม prefix ให�ก�บช้��อแฟั=มที่��ตั�องการoเก8บข�อม'ลโดย่เล�อก Start loading ใน ArffLoader
oก(าหนดข�อม'ลในแฟั=ม iris.arff ให�หาตั�วตั�นไม�การตั�ดส.นใจที่��ด�ที่��ส6ด โดย่ใช้� 5 fold cross-validation ก�บข�#นตัอนว.ธี� J 48 แสดงผลล�พัธี3ที่��ได�ในร'ปิแบบตั�นไม�oแนวที่างวางผ�งการไหล:
DataSource Evaluation J48 Visualization
•เร.�มจากการอ�านแฟั=ม iris.arff•ก(าหนดล�กษณะปิระจ(าที่��ใช้�แที่นคืลาส•แบ�งข�อม'ลออกเปิ�น 5 ส�วนเพั��อที่(า cross-validation•ใช้�ข� #นตัอนว.ธี� J48•แสดงผลล�พัธี3
oเล�อก ArffLoader จากแถบ DataSourcesoปิร�บแตั�งให�เล�อกแฟั=ม iris.arff จาก Configure… เมน'oเล�อก Class Assignment จากแถบ Evaluationoเล�อกคืลาสเปิ=าหมาย่
oเล�อก Cross Validation FoldMaker จากแถบ Evaluationoปิร�บแตั�งให�ม�จ(านวน fold เที่�าก�บ 5oส�งข�อม'ล DataSet จาก Class Assigner
o เล�อก J48 จากแถบ Classifiers
o โย่งข�อม'ลจาก Cross Validation FoldMaker โดย่เล�อก training set และ test set โย่งไปิที่�� J48
o ส��งให�ข�อม'ลน(าเข�า โดย่เล�อก Start loading จาก ArffLoader
oเล�อก Classifiers PerformanceEvaluators จากแถบ Evaluationoโย่งข�อม'ลจาก J48 โดย่เล�อก batchClassifiers โย่งไปิที่�� ClassifiersPerformanceEvaluatorsoสร�าง TextViewer และ/หร�อ Graph Viewer จาก Visualization
oเล�อก Start Loading จากแถบ ArffLoaderoรอจนจบ แล�วเล�อก Show results จาก TextVieweroผลล�พัธี3ที่��ได�แสดงด�งร'ปิซึ่�าย่ซึ่%�งให�คื�าที่��ถ'กตั�อง 96%oใน Confusion Matrix แสดงผลจากการเปิร�ย่บเที่�ย่บก�บกล6�มที่��สนใจ
o การออกแบบผ�งการไหลโดย่ปิรกตั. DataSource Filter Classifier/Clusterers/Association Evaluation Visualization DataSinks
o Filter ใช้�ในการเตัร�ย่มข�อม'ลo Classifier/Clusterers/Association ใช้�ในการสร�างตั�วแบบในการที่(าเหม�องข�อม'ลo Evaluation ใช้�ในการเล�อกตั�วแบบo Visualization ใช้�ในการแสดงผลล�พัธี3ของการที่(าเหม�องข�อม'ลo DataSinks ใช้�ในการเก8บผลล�พัธี3