utilizing of data mining techniques to analyze the data

12
วารสารวิทยาศาสตรŤĒละđทคēนēลยี มทร.สčวรรณภĎมิ ISSN: 2586-8101 ปŘทีę 2 ฉบับทีę 2 (đมษายน ı กันยายน 2561) กćรĔชšđทคนĉคđĀมČĂงขšĂมĎลđพČęĂวĉđครćąĀŤชčดขšĂมĎลĒลąสนĆบสนčน กćรตĆดสĉนĔจสĞćĀรĆบตĞćĒĀนŠงกćรวćงบĎธจĆดĒสดง Utilizing of Data Mining Techniques to Analyze the Data Sets and Decision Support for the Position of Exhibition Booth มงคล ณ ลĞาพĎน* 1 จิตรลดา đพลิดพริĚง 2 อังสนา ผŠอนสčข 3 ฉัตรชัย đกศวรกิตติ 4 ชลธิชา วงษŤĕสว 5 Mongkol Na Lampoon 1 , Chitlada Plirdpring 2 , Angsana Phonsuk 3 , Chatchai Kiatvorakitti 4 , Chonticha Wongsawai 5 1,2,3 สาขาวิชาระบบสารสนเทศและคอมพิวเตอรŤธุรกิจ คณะบริหารธุรกิจและเทคēนēลยีสารสนเทศ 4,5 สาขาเทคēนēลยีสารสนเทศธุรกิจ คณะบริหารธุรกิจและเทคēนēลยีสารสนเทศ มหาวิทยาลัยเทคēนēลยีราชมงคลสุวรรณภูมิ Email: *[email protected] บทคĆดยŠĂ งานวิจัยฉบับนีĚกลŠาวถึงขัĚนตอนการĔชšđทคนิคđหมืองขšอมĎลđพืęอวิđคราะหŤชčดขšอมĎลĒละสนับสนčนการตัดสินĔจ สĞาหรับตĞาĒหนŠงการวางบĎธจัดĒสดง ēดยมีวัตถčประสงคŤđพืęอ 1) สรšางตัวĒบบสĞาหรับการตัดสินĔจตĞาĒหนŠงการวางบĎธ จัดĒสดงดšวยđทคนิค Linear Discriminant Analysis 2) ĔชšตัวĒบบđพืęอสนับสนčนการตัดสินĔจสĞาหรับตĞาĒหนŠง การวางบĎธจัดĒสดง ดšวยĔชšđทคนิคēมđดลการวิđคราะหŤจĞาĒนก Linear Discriminant Analysis ēดยĔชšตัวĒบบขšอมĎล ทีęผŠานกระบวนการวิđคราะหŤ ซึęงคณะผĎšจัดทĞาĕดšวิđคราะหŤชčดขšอมĎลดšวยซอฟตŤĒวรŤ RapidMiner Studio 9 ĔนการđกĘบรวบรวมขšอมĎลจากการลงทะđบียนđขšารŠวมงานēดยกรอกขšอมĎลĒละตอบĒบบสอบถามวŠาทĞาĕมถึง สนĔจงานนีĚĒละđมืęอทางผĎšลงทะđบียนสมัครđสรĘจจะĕดšรับ QR Code ĒละนĞามาĔนงาน ĒละĔนĒตŠบĎธจัดĒสดงจะมีตัว อŠาน QR Code อยĎŠจะบันทึกตĞาĒหนŠงของผĎšđขšารŠวมงานĒละชčดขšอมĎลทีęนĞามา ĕดšĒกŠ ขšอมĎล User ID,ขšอมĎล Booth, ขšอมĎล SEX ,ขšอมĎล Status,ขšอมĎล Reason จากนัĚนจะทĞาการนĞาชčดขšอมĎลทีęĕดšมาทĞาการสรšางตัวĒบบสĞาหรับการ ตัดสินĔจตĞาĒหนŠงการวางบĎธจัดĒสดงดšวยđทคนิค Linear Discriminant Analysis ĒละนĞาชčดขšอมĎลอีกหนึęงชčดทีęđปŨน ขšอมĎลของผĎšทีęลงทะđบียนĔหมŠมาđขšาตัวĒบบĒละทĞานายผลออกมาวŠาบĎธจัดĒสดงĕหนทีęจะมีคนđขšาĕปสนĔจจĞานวนมาก ผลจากการĔชšตัวĒบบĔนสนับสนčนการตัดสินĔจสĞาหรับตĞาĒหนŠงการวางบĎธจัดĒสดงจากจĞานวนบĎธจัดĒสดงทัĚงหมด 174 บĎธจัดĒสดง ĕดšทĞานายผลวŠาผĎšคนทีęลงทะđบียนđขšามาĔหมŠจĞานวน 1,988 คน จะสนĔจบĎธจัดĒสดงĔดđปŨนสŠวนĔหญŠ ēดยมีบĎธจัดĒสดงจĞานวนทัĚงหมด 4 บĎธจัดĒสดง ทีęēดดđดŠนĒละมีผĎšđขšาชมจĞานวนมาก ĕดšĒกŠ 1) บĎธจัดĒสดง H04 ēดย คิดđปŨนจĞานวนคนทีęสนĔจจĞานวน 1,088 คน คิดđปŨนอัตราสŠวน 0.547 2) บĎธจัดĒสดง D10 ēดยคิดđปŨนจĞานวนคนทีę สนĔจจĞานวน 875 คน คิดđปŨนอัตราสŠวน 0.440 3) บĎธจัดĒสดง I10 ēดยคิดđปŨนจĞานวนคนทีęสนĔจจĞานวน 23 คน คิดđปŨนอัตราสŠวน 0.011 4) บĎธจัดĒสดง G06 ēดยคิดđปŨนจĞานวนคนทีęสนĔจจĞานวน 2 คน คิดđปŨนอัตราสŠวน 0.001 ซึęงจากผลการทĞานายพบวŠา บĎธจัดĒสดง H04 đปŨนบĎธจัดĒสดงทีęมีคนđขšามาชมมาก รองลงมาđปŨน D10 Ēละ I10,G06 ตามลĞาดับ พบวŠามีบĎธจัดĒสดง 3 Ĕน 4 มีความสัมพันธŤทีęđหมือนกันอยĎŠ ĕดšĒกŠ ตĞาĒหนŠงทีę 1.บĎธจัดĒสดง Thai

Upload: others

Post on 18-Dec-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101

ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)

การใชเทคนิคเหมืองขอมูลเพื่อวิเคราะหชุดขอมูลและสนับสนุน

การตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดง

Utilizing of Data Mining Techniques to Analyze the

Data Sets and Decision Support for the Position of Exhibition Booth

มงคล ณ ลําพูน*1 จิตรลดา เพลดิพริ้ง2 อังสนา ผอนสุข3 ฉัตรชัย เกศวรกิตติ4 ชลธิชา วงษไสว5

Mongkol Na Lampoon1, Chitlada Plirdpring2 , Angsana Phonsuk 3 , Chatchai Kiatvorakitti 4, Chonticha

Wongsawai 5

1,2,3สาขาวิชาระบบสารสนเทศและคอมพิวเตอรธรุกิจ คณะบรหิารธรุกิจและเทคโนโลยสีารสนเทศ

4,5สาขาเทคโนโลยสีารสนเทศธุรกจิ คณะบริหารธรุกิจและเทคโนโลยีสารสนเทศ

มหาวิทยาลยัเทคโนโลยรีาชมงคลสุวรรณภมู ิ

Email: *[email protected]

บทคัดยอ

งานวิจัยฉบับนี้กลาวถึงขั้นตอนการใชเทคนิคเหมืองขอมูลเพื่อวิเคราะหชุดขอมูลและสนับสนุนการตัดสินใจ

สําหรับตําแหนงการวางบูธจัดแสดง โดยมีวัตถุประสงคเพื่อ 1) สรางตัวแบบสําหรับการตัดสินใจตําแหนงการวางบูธ

จัดแสดงดวยเทคนิค Linear Discriminant Analysis 2) ใชตัวแบบเพื่อสนับสนุนการตัดสินใจสําหรับตําแหนง

การวางบูธจัดแสดง ดวยใชเทคนิคโมเดลการวิเคราะหจําแนก Linear Discriminant Analysis โดยใชตัวแบบขอมูล

ที่ผานกระบวนการวิเคราะห ซึ่งคณะผูจัดทําไดวิเคราะหชุดขอมูลดวยซอฟตแวร RapidMiner Studio 9

ในการเก็บรวบรวมขอมูลจากการลงทะเบียนเขารวมงานโดยกรอกขอมูลและตอบแบบสอบถามวาทําไมถึง

สนใจงานนี้และเมื่อทางผูลงทะเบียนสมัครเสร็จจะไดรับ QR Code และนํามาในงาน และในแตบูธจัดแสดงจะมีตัว

อาน QR Code อยูจะบันทึกตําแหนงของผูเขารวมงานและชุดขอมูลที่นํามา ไดแก ขอมูล User ID,ขอมูล Booth,

ขอมูล SEX ,ขอมูล Status,ขอมูล Reason จากนั้นจะทําการนําชุดขอมูลที่ไดมาทําการสรางตัวแบบสําหรับการ

ตัดสินใจตําแหนงการวางบูธจัดแสดงดวยเทคนิค Linear Discriminant Analysis และนําชุดขอมูลอีกหนึ่งชุดที่เปน

ขอมูลของผูที่ลงทะเบียนใหมมาเขาตัวแบบและทํานายผลออกมาวาบูธจัดแสดงไหนที่จะมีคนเขาไปสนใจจํานวนมาก

ผลจากการใชตัวแบบในสนับสนุนการตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดงจากจํานวนบูธจัดแสดงทั้งหมด

174 บูธจัดแสดง ไดทํานายผลวาผูคนที่ลงทะเบียนเขามาใหมจํานวน 1,988 คน จะสนใจบูธจัดแสดงใดเปนสวนใหญ

โดยมีบูธจัดแสดงจํานวนทั้งหมด 4 บูธจัดแสดง ที่โดดเดนและมีผูเขาชมจํานวนมาก ไดแก 1) บูธจัดแสดง H04 โดย

คิดเปนจํานวนคนที่สนใจจํานวน 1,088 คน คิดเปนอัตราสวน 0.547 2) บูธจัดแสดง D10 โดยคิดเปนจํานวนคนที่

สนใจจํานวน 875 คน คิดเปนอัตราสวน 0.440 3) บูธจัดแสดง I10 โดยคิดเปนจํานวนคนที่สนใจจํานวน 23 คน

คิดเปนอัตราสวน 0.011 4) บูธจัดแสดง G06 โดยคิดเปนจํานวนคนที่สนใจจํานวน 2 คน คิดเปนอัตราสวน 0.001

ซึ่งจากผลการทํานายพบวา บูธจัดแสดง H04 เปนบูธจัดแสดงที่มีคนเขามาชมมาก รองลงมาเปน D10 และ

I10,G06 ตามลําดับ พบวามีบูธจัดแสดง 3 ใน 4 มีความสัมพันธที่เหมือนกันอยู ไดแก ตําแหนงท่ี 1.บูธจัดแสดง Thai

��

วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101

ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)

IoT Association (H04) ตําแหนงที่ 2.บูธจัดแสดง Internet Alliance Silver sponsor (D10) ตําแหนงที่ 3.บูธจัด

แสดง Bangladesh (I10) เปนบูธจัดแสดงที่ตั้ งอยู ในโซน Communications Network Infrastructure and

Security เดียวกัน และตําแหนงที่ 4.บูธจัดแสดง Busan industry (G06) ที่ตั้งอยู ในโซน Data and Cloud;

Business Solutions ซึ่งแสดงใหเห็นวาในงาน CEBIT ASEAN 2018 ผูเขาชมงานสวนใหญใหความสนใจเทคโนโลยี

ด า น Communications Network Infrastructure and Security ถั ด ม า เ ป น Data and Cloud; Business

Solutions.

คําสําคัญ: เทคนิคเหมืองขอมูล Linear Discriminant Analysis สนับสนุนการตัดสินใจตําแหนงการวางบูธ

จัดแสดง

ABSTRACT

This research discusses Utilizing of Data Mining Techniques to Analyze the Data Sets and

Decision Support for the Position of Exhibition Booth. The purpose is to: 1) create models for

decision-making, displaying the booth exhibited by the Linear Discriminant Analysis technique; 2)

use a model to support decision-making for the exhibition booth position. Using the Linear

Discriminant Analysis technique, using analytical data model The team analyzed the data set with

RapidMiner Studio 9 software.

To gather information from the registration, simply fill in the form and answer the

questionnaire as to why you are interested in this job and when the sign up candidate will receive

a QR Code and bring it to the event and in the exhibition booth will come. QR Code readers will

record the location of the exhibitor and the data set that includes User ID, Booth data, SEX data,

Status data, Reason data and then the resulting data sets are created. The decision was made by

Linear Discriminant Analysis and a new set of data was collected from the new registrants and

predicted that the booth would be displayed. Much As a result of the use of models in decision

support for booth positions exhibiting from a total of 174 booths, exhibitors have predicted that

the 1988 entrants will be interested in exhibit booths. There are 4 booths exhibiting the most

prominent and visitors are: 1) Booth exhibit H04, the number of people interested is 1,088 people,

equivalent to 0.547. Dong D10 with the number of interested people is 875, the ratio is 0.440. 3)

Booth displaying I10, the number of interested people is 23, the ratio is 0.011. 4) Booth exhibits

G06, the number of people interested. 2 people, the ratio is 0.001. According to the results, the

booth exhibited H04 as a booth displaying the most visited people, followed by D10 and I10, G06,

respectively. The exhibition booth H04 is a booth exhibiting the most popular people, followed by

the D10 and I10, G06, respectively. There are 3 booths exhibiting the same relationship, namely

position 1. Booth Display the Thai IoT Association (H04). 2nd Place. Internet Alliance Silver Sponsor

(D10). 3rd Place. Bangladesh Display Booth (I10) is an exhibition booth located in the zone.

��

วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101

ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)

Communications Network Infrastructure and Security and location 4. Busan industry exhibit booth

(G06) located in Data and Cloud Zone; Business Solutions, which shows that at CEBIT ASEAN 2018,

most visitors paid attention to technology. side Communications Network Infrastructure and

Security Next came Data and Cloud; Business Solutions Keywords: Data mining techniques Linear Discriminant Analysis Decision support for exhibit booth

design

1. บทนํา

1.1*การวิเคราะหชุดขอมูลเพื่อสนับสนุนการตัดสินใจโดยใชเทคนิคเหมืองขอมูล จัดทําขึ้นเพื่อเปนทางเลือกหนึ่งที่

ใหบริการเปนตัวชวยในการตัดสินใจ โดยนําขอมูลที่มีมาผานกระบวนการวิเคราะหซึ่งขอมูลนั้นเปนสิ่งสําคัญเปนอยาง

มาก ธุรกิจจําเปนตองมีกลยุทธหรือยุทธวิธี (Business Strategies) ที่เช่ือมั่นไดวาจะลดความเสี่ยงขององคกรใหนอยลง

ไดกลยุทธทางธุรกิจจําเปนตองมีเทคโนโลยีสารสนเทศท่ีสามารถวิเคราะห กลั่นกรอง ขอมูลจํานวนมากไดเพื่อใหได

ขอมูลที่มีประโยชนชวยในการตัดสินใจ และที่ไดรับความนิยมคือการทําเหมืองขอมูล (Data Mining) เขามาใช

ผูจัดทําจึงเล็งเห็นความสําคัญในการนําขอมูลสารสนเทศที่มีในองคกรธุรกิจเขามาใชในงานเพื่อเปนชองทางหนึ่งที่

เปนชองทางทางเลือกที่ทํานายผลเพื่อชวยสนับสนุนการตัดสินใจ โดยทางคณะผูจัดทําไดใชเทคนิคเหมืองขอมูล

(Data Mining) เพื่อทําการวิเคราะหชุดขอมูลและสนับสนุนการตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดง โดยใช

ตัวแบบโมเดลวิเคราะหจําแนก (Linear Discriminant Analysis) ใหกับหนวยงานซึ่งในการวิเคราะหชุดขอมูลจะชวย

เพิ่มทางเลือกในการตัดสินใจที่สะดวกรวดเร็ว สามารถจัดเก็บชุดขอมูลและแสดงผลลัพธออกมาในรูปแบบของตาง ๆ

ทั้งรูปแบบของแผนภูมิแทง แผนภูมิวงกลม และอีกหลายรูปแบบเปนจํานวนมาก ออกมาไดชัดเจนเพื่อมองเห็นภาพ

การทํานายผลลัพธท่ีออกมาจากกระบวนการวิเคราะหไดอยางมีประสิทธิภาพ

วัตถุประสงคของงานวิจัย

1. สรางตัวแบบสําหรับการตัดสินใจตําแหนงการวางบูธจัดแสดงดวยเทคนิค Linear Discriminant Analysis

2. ใชตัวแบบเพื่อสนับสนุนการตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดง ดวย ใชเทคนิคโมเดล

การวิเคราะหจําแนก Linear Discriminant Analysis

2. เอกสารและงานวจิัยท่ีเกี่ยวของ

เอกสาร

จากการทบทวนเอกสาร ตํารา และทฤษฎีตางๆ ที่เกี่ยวของในการทําเหมืองขอมูล ดังนี้

1.ความหมายของขอมูล

ขอมูล (Data) หมายถึง ขอเท็จจริงหรือเรื่องราวท่ีเกี่ยวของกับสิ่งตาง ๆ เชน คน สัตว สิ่งของ สถานที่

ฯลฯ โดยอยูในรูปแบบท่ีเหมาะสมตอการสื่อสารการแปลความหมายและการประมวลผลซึ่งขอมูลอาจจะไดมาจาก

การสังเกต การรวบรวม การวัดขอมูลเปนไดทั้งขอมูลตัวเลขหรือสัญลักษณใด ๆ ที่สําคัญจะตองมีความเปนจริงและ

ตอเนื่องตัวอยางของขอมูล เชน ช่ือ เพศ อายุ เปนตน [1]

สารสนเทศ (Information) หมายถึง ขอมูลที่ไดผานกระบวนการประมวลผลแลวอาจใชวิธีงาย ๆ

เชน หาคาเฉลี่ยหรือใชเทคนิคขั้นสูงการวิจัยดําเนินงาน เปนตน เพื่อเปลี่ยนแปลงสภาพขอมูลทั่วไปใหอยูในรูปแบบ

��

วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101

ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)

ที่มีความสัมพันธหรือมีความเกี่ยวของกัน เพื่อนําไปใชประโยชนในการตัดสินใจใหคําตอบปญหาตาง ๆ ไดสารสนเทศ

ประกอบดวยขอมูลเอกสาร เสียง หรือรูปภาพ แตจัดเนื้อเรื่องใหอยูในรูปท่ีมีความหมายสารสนเทศไมใชจํากัดเฉพาะ

เพียงตัวเลขเพียงอยางเดียว [2]

การทําเหมืองขอมูล (Data Mining) คือ การสืบคนความรูที่เปนประโยชนและนาสนใจบนฐานขอมูล

ขนาดใหญ (Knowledge Discovery from very large databases : KDD) หรือเรียกวาการทําเหมืองขอมูลเปน

เทคนิคที่ใชจัดการกับขอมูลขนาดใหญโดยจะนําขอมูลที่มีมาวิเคราะหแลวดึงความรูหรือสิ่งสําคัญออกมาเพื่อใชใน

การวิเคราะหหรือทํานายสิ่งตาง ๆ ที่จะเกิดขึ้นซึ่งการคนหาความรูและความจริงที่แฝงอยูในขอมูล (Knowledge

Discovery) เปนกระบวนการขุดคนสิ่งที่นาสนใจในกองขอมูลที่มีอยูซึ่งตางจากระบบฐานขอมูล (Database

System) ตรงที่การทําเหมืองขอมูลไมตองกําหนดคําสั่งภาษาสอบถามเชิงโครงสราง ( Structured Query

Language) ซึ่งเปนภาษาสอบถามที่นิยมมากที่สุดของการจัดการฐานขอมูล [3]

2.ความสําคัญของขอมูล

ขอมูล หมายถึง ขอเท็จจริงหรือสิ่งที่ถือหรือยอมรับวาเปนขอเท็จจริง สําหรับใชเปนหลักอนุมาน

หาความจริงหรือการคํานวณ [4]

การทําความสะอาดขอมูล (Data Cleaning) Data cleansing หรือ Data cleaning หรือ Data

scrubbing หมายถึง การทําความสะอาดขอมูลเปนกระบวนการตรวจสอบและการแกไข (หรือลบ) รายการขอมูลที่

ไมถูกตองออกไปจากชุดขอมูลตารางหรือฐานขอมูล ซึ่งเปนหลักสําคัญของฐานขอมูล เพราะหมายถึงความ

ไมสมบูรณความไมถูกตองความไมสัมพันธกับขอมูลอื่น ๆ เปนตน จึงตองมีการแทนท่ีการปรับปรุงหรือการลบขอมูล

ที่ไมถูกตองเหลานี้ออกไป เพ่ือใหขอมูลมีคุณภาพ [5]

3.ความสําคัญของสารสนเทศ

สารสนเทศ (Information) ขอมูลตาง ๆ ที่ไดผานการเปลี่ยนแปลงหรือมีการประมวลหรือวิเคราะหผลสรุป

ดวยวิธีการตาง ๆ ใหอยูในรูปแบบท่ีมีความสัมพันธกัน มีความหมายมีคุณคาเพิ่มขึ้นและมีวัตถุประสงคในการใชงาน

[6]

4. ความสําคัญของการทําเหมืองขอมูล

เนื่องดวยปจจุบันเปนยุคที่ขอมูลและสารสนเทศมีความสําคัญ การเผยแพรและสื่อสารขอมูล ขาวสาร

ที่ตรงกับความตองการของผูใชจึงเปนสิ่งจําเปนการประยุกตเทคโนโลยีสารสนเทศเพื่อชวยในการสื่อสารขอมูล

จํานวนมากใหแกผูใช เชน การใหบริการเว็บไซตเพื่อเผยแพรขอมูลขาวสารและแลกเปลี่ยนความรูจึงเปน เครื่องมือ

ที่สําคัญในการสื่อสารขอมูลถึงผูใชจํานวนมาก ดังนั้นการศึกษาเกี่ยวกับพฤติกรรมของผูใชบริการเว็บไซตจะชวยให

องคกรสามารถนําขอมูลมาใชในการวางแผนพัฒนาเว็บไซต ใหตรงกับความตองการใชงานหรือใชในการวางแผน

กลยุทธเพื่อสรางความไดเปรียบทางการแขงขัน [7]

5.ประเภทของเหมืองขอมูล

การทําเหมืองขอมูลนํามาใชแกปญหานับรอยทางธุรกิจไมวาจะเปนการวิเคราะหกลุมลูกคาการเสนอ

หรือการใหคําแนะนําเพิ่มเติมแกลูกคาการคนหาความผิดปกติของชุดขอมูลโดยเฉพาะที่เกี่ยวกับการเงินการจัดทํา

ระดับความเสี่ยงในการจัดการความเสี่ยง การพยากรณหรือคาดคะเนแนวโนมที่จะเกิดขึ้นเราสามารถแบงประเภท

งานในการทําเหมืองขอมูลไดหลายแบบโดยขึ้นกับธรรมชาติของปญหาเหลานี้ [8]

��

วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101

ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)

6.เทคนิคท่ีเลือกมาใช

การจําแนกกลุมดวยเทคนิค (Linear Discriminant Analysis) นี้ทําการวิเคราะหเชิงเสน (LDA) วิธีนี้

จะพยายามคนหาชุดคาผสมเชิงเสนของคุณลักษณะที่ดีที่สุดในการแยกตัวอยางช้ันเรียนตั้งแตสองตัวขึ้นไป ชุดคา

ผสมที่เปนผลลัพธจะถูกใชเปนตัวแบงประเภทเชิงเสน LDA เกี่ยวของกับ ANOVA (การวิเคราะหความแปรปรวน)

และการวิเคราะหถดถอยพหุคูณซึ่งยังพยายามที่จะแสดงตัวแปรที่ขึ้นอยูกับตัวแปรอื่น ๆ ในอีกสองวิธีอยางไรก็ตาม

ตัวแปรขึ้นอยูกับปริมาณที่เปนตัวเลขในขณะที่ LDA เปนตัวแปรที่แบงประเภท (เชนปายช่ือช้ัน) LDA มีสวน

เกี่ยวของกับการวิเคราะหองคประกอบหลัก (PCA) และการวิเคราะหปจจัยดวยเชนกันซึ่งทั้งสองมองหาการ

ผสมผสานของตัวแปรเชิงเสนซึ่งจะอธิบายขอมูลไดดีที่สุด LDA อยางชัดเจนพยายามสรางแบบจําลองความแตกตาง

ระหวางช้ันของขอมูล PCA ในเครื่องมืออ่ืน ๆ ไมไดคํานึงถึงความแตกตางในช้ันใด ๆ [9]

ภาพที่ 1 แสดงตัวอยางการใชการวิเคราะหแนกประเภทเชิงเสน

ขอดีและขอดอยของเทคนิค Linear Discriminant Analysis [9] [10]

ขอดี

1. การวิเคราะหดวยวิธีนี้นอกจากจะสามารถจําแนกความแตกตางระหวางกลุมสองไดแลวยังสามารถอธิบาย

หรือคาดการณไดดวย

2. Multivariate Normal ตัวแปรอิสระตองเปนอิสระและสุมมาจากประชากรที่มีการแจกแจงแบบปกติ

หลายตัวแปร

3. มีอํานาจการทดสอบที่มากถาขอมูลเปนไปตามขอกําหนด

ขอดอย

1. จะแปลงขอมูลทั้งหมดยกเวนขอมูลที่จะทํานายใหอยูในรูปแบบตัวเลขกอน

2. ตองการกลุมตัวอยางสําหรับการประมาณคาและกลุมตัวอยางที่ใชในการตรวจสอบความถูกตองของ

การพยากรณ

��

วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101

ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)

งานวิจัยท่ีเกี่ยวของ

กฤษดา เชียรวัฒนสุข และสุรพร ออนพทุธา (2560) งานวิจัยเรื่อง การจําแนกกลุมลูกคาที่คํานึงถึงคุณภาพกอน

ตัดสินใจซื้อโดยใชปจจัยสวนประสมการตลาดบริการ (7Ps) จากการศึกษาพบวา ปจจัยสวนประสมการตลาดบริการ

ทั้ง 7 ดาน ประกอบดวย ดานผลิตภัณฑ ดานราคา ดานสถานท่ี ดานสงเสริมการขาย ดานกระบวนการ ดานบุคคล

และดานลักษณะทางกายภาพมีเพียง 4 ดานเทานั้นที่สามารถนํามาวิเคราะหเพื่อจําแนกกลุม คือ ดานบุคคล

ดานผลิตภัณฑ ดานราคาและ ดานกระบวนการ โดยการศึกษายังพบวา สวนประสมการตลาดบริการดานบุคคล

เปนตัวแปรที่สําคัญมาก ที่สุดในการแบงกลุมลูกคาระหวางกลุมลูกคาที่คํานึงถึงราคากอนตัดสินใจซื้อและกลุมลูกคา

ที่คํานึงถึงคุณภาพกอนตัดสินใจซื้อ ดังบทคัดยอดังนี้ งานวิจัยนี้มีวัตถุประสงค เพื่อศึกษาปจจัยสวนประสมทาง

การตลาดบริการ (7Ps) ที่มีอิทธิพลตอการจําแนกกลุมลูกคาที่คํานึงถึงราคาและคุณภาพกอนตัดสินใจซื้อ โดยใช

แบบสอบถามกลุมประชากร 9 ตัวอยางจํานวน 402 คน คือ ผูใชบริการเครือขายโทรศัพทเคลื่อนที่ดีแทค (DTAC)

ทั้งในระบบรายเดือน และระบบเติมเงินโดยทําการเก็บตัวอยางจากกลุมประชากรที่อาศัยอยูในยานการคาในเขต

อําเภอเมือง อําเภอธัญบุรี อําเภอลําลูกกา สถิติที่ใชในการวิเคราะหประกอบดวยการหาคาความถี่คารอยละคาเฉลี่ย

และสวนเบี่ยงเบนมาตรฐานสถิติทดสอบ Wilks' Lambda และการวิ เคราะหจําแนกกลุมโดยใช เทคนิค

Discriminant Analysis เพื่อหาฟงกชัน เพื่อจําแนกกลุมของ Fisher (Fisher's linear discriminant functions)

ผลการวิจัย พบวาสวนประสมทางการตลาดบริการดานบุคคล (Coefficients = .781) เปนปจจัยที่มีอิทธิพลมาก

ที่สุดในการที่จําแนกวาจะเปนลูกคาที่คํานึงถึงราคาและคํานึงถึงคุณภาพกอนตัดสินใจซื้อรองลงมาคือดานผลิตภัณฑ

(Coefficients = .650) ดานราคา (Coefficients = -.525) และดานกระบวนการ (Coefficients = -.212)

ตามลําดับ

Claes Andersson (2013) ง า น วิ จั ย เ รื่ อ ง Multivariate signal approaches for object detection using

microwave sensing จากการศึกษาพบวา การวิเคราะหขอมูลแสดงใหเห็นวาในกรณีที่ไมมีเสียงรบกวนชวงต่ําสุด

ของชวงความถี่จะทําใหเกิดการแบงแยกระหวางสัญญาณจากวัตถุและการวัดพื้นหลังที่ใหญที่สุดเมื่อเทียบกับ

คาเบี่ยงเบนมาตรฐานที่เกี่ยวของ ดังบทคัดยอดังนี้การตรวจจับไมโครเวฟสามารถใชเพื่อตรวจจับวัตถุในวัสดุที่ไหล

ผานทอโดยการตรวจจับการเปลี่ยนแปลงของสัญญาณ ในงานนี้การจําลองแบบจําลองขอมูลจํา ลองนี้ใชเพื่อ

ตรวจสอบความเปนไปไดที่จะแยกการเปลี่ยนแปลงที่เกิดจากฟองอากาศออกจากการเปลี่ยนแปลงที่เกิดจากวัตถุ

พลาสติกหรือโลหะ ขอมูลที่ใชจะไดรับจากการสมการเชิงตัวเลขของสมการ Maxwell โดย FEM สําหรับจุดตัดกัน

ของโพรงทรงกระบอกที่มีทอนําคลื่นสี่ตัว โซลูช่ันประกอบดวยคาของพารามิเตอรกระจายที่ 400 ความถี่ในชวง

ไมโครเวฟ ขอมูลการสรางแบบจําลองวัสดุพื้นหลังที่เปนเนื้อเดียวกันที่มีและไมมีวัตถุชนิดดังกลาวมีการวิเคราะหและ

ใชในการประเมินประเภทของผูจัดจําแนกประเภท: K เพื่อนบานที่ใกลที่สุด (KNN), การวิเคราะหจําแนกเชิงเสน

(LDA), การวิเคราะหแบบจําแนกกําลังสอง (QAD), เครื่องเวกเตอรสนับสนุน (SVM) และ libSVM - อัลกอริทึมของ

เวคเตอรเวกเตอรสนับสนุนสําหรับการจัดกลุมขอมูลหลายชั้น นอกจากนี้ยังมีการตรวจสอบวาสวนใดของชวงความถี่

และสิ่งที่องคประกอบเมทริกซีนกระจายเปนประโยชนมากที่สุดสําหรับการจําแนกประเภท การตรวจสอบจะมีการ

ตรวจสอบความดังของเสียงในการวัดดวยสัญญาณรบกวนสีขาว พบวาในกรณีที่ไมมีเสียงรบกวนชวงต่ําสุดของชวง

ความถี่จะมีประโยชนมากท่ีสุดสําหรับการตรวจจับวัตถุ แตยังรวมถึงการเพิ่มเสียงรบกวนมากที่สุดในความถี่เหลานี้

สําหรับผูจัดจําแนกประเภทเครื่องวัดคุณภาพ LDA, QDA และ libSVM ทั้งหมดจะทํางานไดดีเมื่อไมมีเสียงดัง

ในขณะที่การเพิ่มเสียงรบกวนจะชวยลดความถูกตองของตัวจําแนกประเภทการจําแนกแยกแยะผูจัดจําแนกประเภท

��

วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101

ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)

libSVM แสดงใหเห็นถึงผลลัพธ ที่คาดหวังที่ระดับ SNR เกินกวา 30 dB ที่ระดับ SNR จาก 20 เดซิเบลและ

ดานลางที่ไมใชของผูจัดจําแนกประเภทจะใหความแมนยําที่จะตอบสนองความตองการของเครื่องตรวจจับที่เปน

ประโยชนในทางปฏิบัติ สุดทายจะมีการตรวจสอบการสรางแบบจําลองขอมูลแบบไมตอเนื่อง ในการวิเคราะห

เบื้องตนพบวาไมพบความสัมพันธเชิงเสนซึ่งนําไปสูการประเมินผลของการแปลงขอมูลเพื่อขจัดความเกี่ยวของ

เชิงเสนตรงหรือสมการเชิงเสน วิธีการประเมินคืออัลกอริธึมการตรวจจับสัญญาณที่งายและผลการทดสอบช้ีใหเห็น

ถึงการปรับปรุงบางสวนแมวาจะมีขนาดเล็กมากก็ตาม

3. วิธีการวิจัย

การจัดทําการใชเทคนิคเหมืองขอมูลเพื่อวิเคราะหชุดขอมูลและสนับสนุนการตัดสินใจสําหรับตําแหนง

การวางบูธจัดแสดงผูจัดทําไดดําเนินการโดยแบงได 2 ระยะดังนี้

ระยะที่ 1 สรางตัวแบบสําหรับการตัดสนิใจตําแหนงการวางบูธจัดแสดงดวยเทคนิค Linear Discriminant Analysis

1.1 ศึกษาการใชเทคนิคดาตาไมนนิงในการสรางชุดขอมูลสนับสนุนการตัดสินใจสําหรับตําแหนงการวาง

บูธจัดแสดง ผูจัดทําไดมีการศึกษาคนควาหาขอมูลและศึกษาเทคนิคโมเดลการวิเคราะหจําแนก ( Linear

Discriminant Analysis)

1.2 ทําการเก็บขอมูลจากผูเขารวมงานจํานวน 1,988 คนจากชองทางการลงทะเบียนและความสนใจของผู

เขารามงานในการเดินเขาตามบูธจัดแสดงจํานวน 174 บูท

1.3 ทําความสะอาดขอมูลที่เก็บรวบรวมมาเพื่อใหขอมูลที่นํามาสรางตัวแบบมีความสมบูรณมากท่ีสุดโดยจะ

แบงไดเปน 3 ขั้นตอน

1.3.1 แจกแจงขอมูลโดยจะทําการตั้งช่ือหัวคอลัมนของชุดขอมูลใหมเพื่อใหสามารถแยกแยะไดชัดเจน

1.3.2 แกไขขอมูลที่ผิดพลาด โดยเราจะทําการตรวจสอบวาชุดขอมูลนั้นไดมีการกรอกขอมูลครบทุกชอง

หรือไมถาหากมีชองที่วางจะทําการตัดแถวนั้นออกไมนํามาใชในการประมวลผล

1.3.3 ทําการปรับขอมูลใหเปนรูปแบบตัวเลขจํานวนเต็มโดยจะมีเพียงขอมูลบูธจดัแสดง(Booth) เทานั้น

ที่จะตองยังเปนขอความเชนเดิม

1.4 นําชุดขอมูลที่ใชในการสรางตัวแบบสําหรับการตัดสินใจตําแหนงการวางบูธจัดแสดงดวยเทคนิค Linear

Discriminant Analysis ไดแก ขอมูล User ID,ขอมูล Booth, ขอมูล SEX ,ขอมูล Status ,ขอมูล Reason

1.5 ไดตัวแบบโมเดล Linear Discriminant Analysis สําหรับการตัดสินใจสําหรับตําแหนงการวางบูธ

จัดแสดง

ระยะที่ 2 การใชตัวแบบการตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดง

2.1 ทําการเก็บขอมูลจากผูที่ลงทะเบียนเขารวมงานใหมโดยขอมูลชุดนี้จะไมมีขอมูลบูธจัดแสดง(Booth)

2.2 ทําความสะอาดขอมูลที่เก็บรวบรวมเพื่อใหผลการทํานายออกมีความสมบูรณมากที่สุดโดยจะแบงไดเปน

3 ขั้นตอน

2.2.1 แจกแจงขอมูลโดยจะทําการตั้งช่ือหัวคอลัมนของชุดขอมูลใหมเพื่อใหสามารถแยกแยะไดชัดเจน

2.2.2 แกไขขอมูลที่ผิดพลาด โดยเราจะทําการตรวจสอบวาชุดขอมูลนั้นไดมีการกรอกขอมูลครบทุกชอง

��

วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101

ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)

หรือไมถาหากมีชองที่วางเราจะตัดแถวน้ันออกไมนํามาใชในการประมวลผล

2.2.3 ทําการปรับขอมูลใหเปนรูปแบบตัวเลขจํานวนเต็ม

2.3 นําชุดขอมูลอีกหนึ่งชุดที่เปนขอมูลของผูที่ลงทะเบียนใหมมาเขาตัวแบบโมเดล Linear Discriminant

Analysis สําหรับการตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดง

2.4 ทํานายผลวาบูธจัดแสดงไหนที่จะมีคนเขาไปสนใจจํานวนมาก

4. ผลการวิจัย

4.1 ผลการสรางตัวแบบ

จากการเก็บรวบรวมขอมูลและนําขอมูลมาทําการสรางตัวแบบโมเดล Linear Discriminant Analysis ที่สราง

ขึ้นพบวาสามารถใชในการทํานายขอมูลออกมาไดโดยการหาความนาจะเปนเบื้องตนเพื่อที่จะใชการทําตัวแบบและ

ขอมูลที่ใช ไดแก ขอมูล User ID,ขอมูล Booth, ขอมูล SEX ,ขอมูล Status ,ขอมูล Reason เปนหลักในการสราง

ตัวแบบ

ตารางที่ 2 แสดงผลการวิเคราะหหาประสิทธิภาพของชุดขอมูล

หัวขอประเมนิ X ..DS ระดับประสิทธิภาพ

1. จํานวนของขอมูลมีมากเพียงพอในการนํามาวิเคราะห 5.00 0.00 มากที่สุด

2. ขอมูลมีความถูกตองครบถวน 5.00 0.00 มากที่สุด

3. ขอมูลมีความทันสมัย 5.00 0.00 มากที่สุด

4. ขอมูลมีความเหมาะสมในการนาํมาวิเคราะห 5.00 0.00 มากที่สุด

รวม 5.00 0.00 มากที่สุด

จากตารางที่ 2*ผลการวิเคราะหหาประสิทธิภาพของชุดขอมูล พบวา ในภาพรวมมีประสิทธิภาพของชุดขอมูลอยูใน

ระดับมากที่สุด (�̅�=5.00) จํานวนของขอมูลมีมากเพียงพอในการนํามาวิเคราะหอยูในระดับมากที่สุด (�̅�=5.00)

โดยขอมูลมีความถูกตองครบถวน อยูในระดับมากที่สุด (�̅�= 5.00) ขอมูลมีความทันสมัย อยูในระดับมากที่สุด

(�̅�=5.00) ขอมูลมีความเหมาะสมในการนํามาวิเคราะห อยูในระดับมากท่ีสุด (�̅�=5.00)

ตารางที่ 3 แสดงผลการวิเคราะหหาความพึงพอใจของโมเดลการวิเคราะหจําแนก (Linear Discriminant Analysis)

รายการ X ..DS ระดับประสิทธิภาพ

1. โมเดลมีความเหมาะสมในการนํามาวิเคราะห 4.70 0.60 มาก

2. โมเดลสามารถจําแนกกลุมขอมลูไดตามที่กําหนด 4.70 0.60 มาก

3. โมเดลสามารถพยากรณขอมลูออกมาในรูปแบบที่ตองการได 4.70 0.60 มาก

4. โมเดลสามารถรบัคาตัวแปรอิสระ 4.00 0.00 มาก

5. โมเดลสามารถจําแนกกลุมการวิเคราะหไดอยางชัดเจน 5.00 0.00 มากที่สุด

6. โมเดลสามารถสื่อกับขอมูลไดสอดคลองตรงกับความตองการ 5.00 0.00 มากที่สุด

รวม 4.70 0.40 มาก

��

วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101

ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)

จากตารางที ่3 แสดงผลการวิเคราะหหาความพึงพอใจของโมเดลการวิเคราะหจําแนก (Linear Discriminant

Analysis) ในภาพรวมมีความพึงพอใจอยูในระดับมาก (�̅�=4.70) โดยโมเดลมีความเหมาะสมในการนํามาวิเคราะห

อยูในระดับมาก (�̅�=4.70) โมเดลสามารถจําแนกกลุมขอมูลไดตามที่กําหนดอยูในระดับมาก (�̅�=4.70) โมเดล

สามารถพยากรณขอมูลออกมาในรูปแบบท่ีตองการได อยูในระดับมากท่ีสุด (�̅�=4.70) โมเดลสามารถรับคาตัวแปร

อิสระอยูในระดับมาก (�̅�=4.00) โมเดลสามารถจําแนกกลุมการวิเคราะหไดอยางชัดเจน อยูในระดับมากที่สุด

(�̅�=5.00) โมเดลสามารถสื่อกับขอมูลไดสอดคลองตรงกับความตองการ (�̅�=5.00)

4.2 ผลการวิเคราะหชุดขอมูล

ผลจากกระบวนการวิเคราะหชุดขอมูลเพื่อสนับสนุนการตัดสินใจสําหรับตําแหนงการวางบู ธจัดแสดง ดวย

เทคนิคโมเดลการวิเคราะหจําแนก Linear Discriminant Analysis โดยจากจํานวน บูธจัดแสดงทั้งหมด 174 บูธ

จัดแสดง ซึ่งไดทํานายผลโดยการนําขอมูลของผูรวมงานจากงาน ที่เคยจัดมาแลวมา Training เพื่อทํานายวาผูคน

ที่ลงทะเบียนเขามาใหมจะสนใจบูธจัดแสดงไหนเปนสวนใหญ โดยมีบูธจัดแสดงทั้งหมด 4 บูธจัดแสดง ที่โดดเดนและ

มีคนเขาชมจํานวนมาก ไดแก 1) บูธจัดแสดง H04 โดยคิดเปนจํานวนคนท่ีสนใจจํานวน 1,088 คน คิดเปนอัตราสวน

0.547 2) บูธจัดแสดง D10 โดยคิดเปนจํานวนคนท่ีสนใจจํานวน 875 คน คิดเปนอัตราสวน 0.440 3) บูธจัดแสดง

I10 โดยคิดเปนจํานวนคนท่ีสนใจจํานวน 23 คน คิดเปนอัตราสวน 0.011 4) บูธจัดแสดง G06 โดยคิดเปนจํานวน

คนท่ีสนใจจํานวน 2 คน คิดเปนอัตราสวน 0.001 ซึ่งจาก ผลการทํานายพบวาบูธจัดแสดง H04 เปนบูธจัดแสดงที่มี

คนเขามาชมมาก รองลงมาเปน D10 และ I10,G06 ตามลําดับ (ดังตาราง ตารางที่ 4 )

ตารางที่ 4 แสดงผลการวิเคราะหชุดขอมูล

ลําดับ

(Index)

บูธจัดแสดงที่ทํานาย

(Nominal value)

จํานวนคน

(Absolute count)

สัดสวน

(Fraction)

1 H04 1088 0.547283702

2 D10 875 0.440140845

3 I10 23 0.011569416

4 G06 2 0.001006036

โดยสามารถจะแสดงออกมาในรูปแบบ Chart ใหเกิดความเขาใจไดงายโดยจะแบงออกเปน 2 แบบ

��

วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101

ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)

ภาพที่ 2 รูปแบบ Chart แบบ Pie และ แบบ Bars

ภาพที ่3 ตําแหนงของบูธจัดแสดงท่ีผานกระบวนการทํานาย

5. อภิปรายผลและขอเสนอแนะการวิจัย

จากการสรางตัวแบบสําหรับการตัดสินใจตําแหนงการวางบูธจัดแสดงดวยเทคนิค Linear Discriminant

Analysis ประกอบไปดวยขอมูลที่เก็บรวบรวมจากผูเขารวมงานและใชในการสรางตัวแบบ ไดแก ขอมูล User ID,

ขอมูล Booth, ขอมูล SEX ,ขอมูล Status ,ขอมูล Reason เปนหลักในการสราง

การใชตัวแบบเพื่อสนับสนุนการตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดง ดวยใชเทคนิคโมเดลการ

วิเคราะหจําแนก Linear Discriminant Analysis จากผลการวิจัยพบวา ทั้ง 4 บูธจัดแสดงที่ทํานายออกมา พบวา

มีบูธจัดแสดง 3 ใน 4 มีความสัมพันธท่ีเหมือนกันอยู ไดแก ตําแหนงที่ 1.บูธจัดแสดง Thai IoT Association (H04)

ตําแหนงที่ 2.บูธจัดแสดง Internet Alliance Silver sponsor (D10) ตําแหนงที่ 3.บูธจัดแสดง Bangladesh (I10)

เปนบูธจัดแสดงท่ีตั้งอยูในโซน Communications Network Infrastructure and Security เดียวกัน และตําแหนง

��

วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101

ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)

ที่ 4.บูธจัดแสดง Busan industry (G06) ที่ตั้งอยูในโซน Data and Cloud; Business Solutions ซึ่งแสดงใหเห็น

วาในงาน CEBIT ASEAN 2018 ผูเขาชมงานสวนใหญใหความสนใจเทคโนโลยีดาน Communications Network

Infrastructure and Security ถัดมาเปน Data and Cloud; Business Solutions.

ขอเสนอแนะการวิจัย ผูวิจัยไดดําเนินการภายใตขอจํากัดทางดานเวลาขอมูลซึ่ง สงผลตองานวิจัยทําใหงานวิจัยมีขอบกพรองอยูบาง

ดังนั้นผูวิจัยจึงไดเสนอแนะแนวทางการปรับปรุงงานวิจัยในอนาคตตอไป

1.การทําเหมืองขอมูลนั้นมีหลายขั้นตอนวิธี ซึ่งแตละขั้นตอนวิธีมีความเหมาะสมกับความตองการดังนั้นจึงตอง

ทําความเขาใจและเลือกขั้นตอนวิธีท่ีตรงกับความตองการใหมากที่สุด

2.การศึกษาวิจัยในครั้งนี้เปนการนําขอมูลของผูเขารวมงานจากในงาน CEBIT ASEAN 2018 มาเพียงบางสวน

เทานั้นดังนั้นหากตองการทําใหงานวิจัยนี้มีความแมนยํามากที่สุดควรที่จะนําขอมูลทั้งหมดมาวิเคราะห

3.เครื่องคอมพิวเตอรที่ใชในการทําเหมืองขอมูลนั้นควรเปนเครื่องที่มีประสิทธิภาพเหมาะสมเนื่องจากข้ันตอน

การทํางานตองใชขอมูลจํานวนมากจึงใชเวลาในการประมวลผลคอนขางนาน ถาเครื่องคอมพิวเตอรที่นํามาใชงาน

ไมมีประสิทธิภาพที่เหมาะสมอาจจะทําใหเครื่องคางและเสียเวลาในการดําเนินการที่นานขึ้น

คําขอบคุณ

ขอขอบคุณ บริษัท โซเซียลคลาวด จํากัด ที่ใหความอนุเคราะหขอมูลในการจัดทําพัฒนาการใชเทคนิคเหมือง

ขอมูล เพื่อวิเคราะหชุดขอมูลและสนับสนุนการตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดง ในครั้งนี ้

6. เอกสารอางอิง

[1] อินทัศน ศรีนิบูลย. (2558). ขอมูล (Data) สืบคนจาก http://oknation.nationtv.tv/blog/Inthat

/2015/01/13/entry-1/comment

[2] อินทัศน ศรีนิบูลย. (2558). สารสนเทศ(Information) สืบคนจาก http://oknation.nationtv.tv/blog

/Inthat/2015/01/13/entry-1/comment

[3] สายชล สินสมบูรณทอง. (2560). หนงัสือการทําเหมืองขอมูล(Data Mining)เลม1. จามจุรีโปรดักส กรุงเทพฯ :

ผูแตง.

[4] พจนานุกรมฉบับราชบัณฑิตยสถาน. (2554). ขอมูล สืบคนจาก http://www.royin.go.th/dictionary/

[5] Rahm, Erhard and Do, (2012). Hong-Hai. Data Cleaning : Problems and Current Approaches.

สืบคนจาก https://www.betterevaluation.org/sites/default/files/data_cleaning.pdf

[6] ไพโรจน คชชา. (2542). ความรูคอมพิวเตอรและเทคโนโลยีสารสนเทศ.เซ็นเตอรดสิคัฟเวอร ีกรุงเทพฯ : ผูแตง.

[7] Bartolini, G. (2001). Web usage mining and discovery of association rules from http servers’logs.

Melbourne: Monash University.

[8] Tang, Z. and J. MacLennan. (2005). Data Mining with SQL Server, Wiley Publishing,

Inc.10475 Crosspoint Boulevard Indianapolis, IN 46256

��

วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101

ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)

[9] ขอดีและขอดอยของเทคนิคLinear Discriminant Analysis. (ออนไลน). สืบคนจาก

https://docs.rapidminer.com/latest/studio/operators/modeling/predictive/discrimina

nt_analysis/linear_discriminant_analysis.html

[10] แสงหลา ชัยมงคล. (2554). การเลือกใชระหวาง Logistic Regression กับ Discriminant Analysis.

, สืบคนจาก http://rlc.nrct.go.th/ewt_dl.php?nid=889

��