analisa sentimen terhadap aplikasi - repository bsi

i

ANALISA SENTIMEN TERHADAP APLIKASI

PEMBELAJARAN DARING MENGGUNAKAN ALGORITMA

KLASIFIKASI DATA MINING

TESIS

Diajukan sebagai salah satu syarat untuk memperoleh gelar

Magister Ilmu Komputer (M.Kom)

RECHA ABRIANA ANGGRAINI

14002216

PROGRAM PASCASARJANA MAGISTER ILMU KOMPUTER

SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER

NUSA MANDIRI

2020

ii

ANALISA SENTIMEN TERHADAP APLIKASI

PEMBELAJARAN DARING MENGGUNAKAN ALGORITMA

KLASIFIKASI DATA MINING

TESIS

Diajukan sebagai salah satu syarat untuk memperoleh gelar

Magister Ilmu Komputer (M.Kom)

RECHA ABRIANA ANGGRAINI

14002216

PROGRAM PASCASARJANA MAGISTER ILMU KOMPUTER

SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER

NUSA MANDIRI

2020

iii

SURAT PERNYATAAN ORISINALITAS DAN BEBAS PLAGIARISM

Yang bertandatangan dibawah ini:

Nama : Recha Abriana Anggraini

NIM : 14002216

Program Studi : Ilmu Komputer

Jenjang : Strata Dua (S2)

Konsentrasi : Data Mining

Dengan ini menyatakan bahwa tesis yang telah saya buat dengan judul:

“Analisa Sentimen Terhadap Aplikasi Pembelajaran Daring Menggunakan

Algoritma Klasifikasi Data Mining” adalah hasil karya sendiri, dan semua sumber

baik yang kutip maupun yang dirujuk telah saya nyatakan dengan benar dan tesis

belum pernah diterbitkan atau dipublikasikan dimanapun dan dalam bentuk

apapun.

Demikianlah surat pernyataan ini saya buat dengan sebenar-benarnya Apabila

dikemudian hari ternyata saya memberikan keterangan palsu dan atau ada pihak

lain yang mengklaim bahwa tesis yang telah saya buat adalah hasil karya milik

seseorang atau badan tertentu, saya bersedia diproses baik secara pidana maupun

perdata dan kelulusan saya dari Program Studi Ilmu Komputer (S2) Sekolah

Tinggi Manajemen Informatika dan Komputer Nusa Mandiri dicabut/dibatalkan.

Jakarta, 05 Agustus 2020

Yang menyatakan,

Recha Abriana Anggraini

vi

KATA PENGANTAR

Puji syukur penulis panjatkan kehadirat Allah SWT, yang telah

melimpahkan rahmat dan karunia-Nya, sehingga pada akhirnya penulis dapat

menyelesaikan tesis ini tepat pada waktunya. Tesis ini penulis sajikan dalam

bentuk buku yang sederhana. Adapun judul tesis yang penulis ambil yaitu

“Analisa Sentuimen Terhadap Aplikasi Pembelajaran Daring Menggunakan

Algoritma Klasifikasi Data Mining”.

Tujuan penulisan tesis ini adalah sebagai salah satu syarat untuk

mendapatkan gelar Magister Ilmu Komputer (M.Kom) pada Program Studi Ilmu

Komputer (S2) STMIK Nusa Mandiri. Dalam penyusunan tesis ini penulis

melakukan riset dan analisis data dari komentar yang diberikan pengguna aplikasi

pembelajaran daring yang ada di google playstore untuk mengetahui

kecenderungan komentar yang diberikan, apakah cenderung positif atau negatif.

Penulis juga mencari dan menganalisa berbagai macam sumber referensi, baik

dalam bentuk jurnal ilmiah, buku-buku literatur, internet, dll yang terkait dengan

pembahasan pada tesis ini.

Penulis menyadari bahwa tanpa bimbingan dan dukungan dari semua pihak

dalam pembuatan tesis ini, maka penulis tidak dapat menyelesaikan tesis ini tepat

pada waktunya. Untuk itu, pada kesempatan ini penulis ingin mengucapkan

terima kasih yang sebesar-besarnya kepada :

1. Kepala STMIK Nusa Mandiri Jakarta

2. Ketua Program Studi Ilmu Komputer STMIK Nusa Mandiri Jakarta

3. Bapak Dr. Windu Gata, M.Kom selaku pembimbing tesis yang telah

berkenan menyediakan waktu dan tenaga serta membagikan ilmu dalam

membimbing penulis untuk menyelesaikan tesis ini.

4. Orang tua dan partner tercinta yang selalu memberikan motivasi, doa dan

dukungan baik moril maupun materiil yang tidak dapat terbalaskan dengan

apapun juga.

5. Teman-teman seperjuangan, khususnya kelas 14.2B yang sangat luar biasa.

vii

6. Dan untuk seluruh teman-teman diluar sana yang ikut membantu penulis

yang tidak dapat disebutkan satu persatu.

Akhir kata, penulis berharap laporan tesis ini memiliki nilai positif

tersendiri bagi setiap orang yang membacanya. Penulis menyadari, dalam

penyajian tesis ini masih banyak kekurangannya. Besar harapan penulis agar

para pembaca memberikan masukan berupa kritik dan saran yang membangun

demi kesempurnaan laporan tesis ini.


Penulis,


viii

SURAT PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH

UNTUK KEPENTINGAN AKADEMIS

Yang bertandatangan dibawah ini, saya:

Nama : Recha Abriana Anggraini

NIM : 14002216




Jenis Karya : Tesis

Demi pengembangan ilmu pengetahuan, dengan ini menyetujui untuk

memberikan ijin kepada pihak Program Studi Ilmu Komputer (S2) Sekolah Tinggi

Manajemen Informatika dan Komputer Nusa Mandiri (STMIK Nusa Mandiri)

Hak Bebas Royalti Non-Eksklusif (Non-exclusive Royalti-Free Right) atas

karya ilmiah kami yang berjudul : “Analisa Sentimen Terhadap Aplikasi

Pembelajaran Daring Menggunakan Algoritma Klasifikasi Data Mining” beserta

perangkat yang diperlukan (apabila ada).

Dengan Hak Bebas Royalti Non-Eksklusif ini pihak STMIK Nusa Mandiri

berhak menyimpan, mengalih-media atau bentuk-kan, mengelolaannya dalam

pangkalan data (database), mendistribusikannya dan menampilkan atau

mempublikasikannya di internet atau media lain untuk kepentingan akademis

tanpa perlu meminta ijin dari kami selama tetap mencantumkan nama kami

sebagai penulis/pencipta karya ilmiah tersebut.

Saya bersedia untuk menanggung secara pribadi, tanpa melibatkan pihak

STMIK Nusa Mandiri, segala bentuk tuntutan hukum yang timbul atas

pelanggaran Hak Cipta dalam karya ilmiah saya ini.

Demikian pernyataan ini saya buat dengan sebenarnya.


Yang menyatakan,


xi

Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri

DAFTAR ISI

Halaman sampul .......................................................................................... i

Halaman judul ............................................................................................ ii

Surat Pernyataan Orisinalitas dan Bebas Plagiarisme ................................ iii

Lembar Persetujuan dan Pengesahan Tesis ................................................ iv

Lembar Konsultasi Pembimbing ................................................................ v

Kata Pengantar ........................................................................................... vi

Surat Pernyataan dan Persetujuan Publikasi .............................................. viii

Abstrak ....................................................................................................... ix

Daftar Isi ..................................................................................................... xi

Daftar Tabel ............................................................................................... xii

Daftar Gambar ............................................................................................ xiii

Daftar Lampiran ......................................................................................... xiv

BAB I. Pendahuluan .................................................................................. 1

1.1. Latar Belakang Penulisan .......................................................... 1

1.2. Identifikasi Masalah .................................................................. 2

1.3. Tujuan Penelitian ....................................................................... 3

1.4. Ruang Lingkup Penelitian ......................................................... 3

1.5. Sistematika Penulisan ................................................................ 3

BAB II. Landasan Teori ............................................................................. 5

2.1. Tinjauan Pustaka ....................................................................... 5

2.1.1. Sentimen analysis .......................................................... 5

2.1.2. Data mining ................................................................... 5

2.1.3. Text mining .................................................................... 6

2.1.4. Aplikasi mobile .............................................................. 10

2.1.5. Ruang guru ..................................................................... 10

2.1.6. Zenius ............................................................................ 11

2.1.7. Naïve Bayes ................................................................... 11

2.1.8. K-Nearest Neighbour ..................................................... 12

2.1.9. Decision Tree ................................................................. 13

2.1.10. KNIME .......................................................................... 13

2.1.11. Webharvy ....................................................................... 13

2.1.12. Gataframework .............................................................. 14

2.2. Tinjauan Studi ........................................................................... 14

2.3. Tinjauan Objek Penelitian ......................................................... 24

BAB III. Metodologi Penelitian ................................................................. 25

BAB IV. Hasil Penelitian Dan Pembahasan .............................................. 29

BAB V. Penutup ........................................................................................ 63

5.1. Kesimpulan ............................................................................... 63

5.2. Saran ......................................................................................... 63

Daftar Pustaka ............................................................................................ 64

Daftar Riwayat Hidup ................................................................................ 67

xii


DAFTAR TABEL

Tabel 2.1. Perbedaan peranan data mining ................................................ 6

Tabel 2.2. Rangkuman penelitian terkait ................................................... 14

Tabel 4.1. Hasil pelabelan terhadap dataset review pengguna aplikasi

ruangguru .................................................................................................... 35

Tabel 4.2. Hasil pelabelan terhadap dataset review pengguna aplikasi

zenius .......................................................................................................... 35

Tabel 4.3. Perbandingan komentar sebelum dan sesusah case folding ...... 37

Tabel 4.4. Perbandingan komentar sebelum dan sesudah regex filter ....... 37

Tabel 4.5. Hasil stemming .......................................................................... 38

Tabel 4.6. Perbandingan komentar sebelum dan sesudah di stopeord ....... 39

Tabel 4.7. Term yang dibentuk dari proses pembentukan BoW ................ 40

Tabel 4.8. Pembobotan TF-IDF ................................................................. 42

Tabel 4.9. Confussion matrix dari dataset ruangguru yang diolah dengan

metode decision tree dan cross validation .................................................. 46


metode decision tree dan partitioning ....................................................... 46


metode naïve bayes dan cross validation ................................................... 49


metode naïve bayes dan partitioning ......................................................... 49

Tabel 4.13 Confussion matrix dari dataset ruangguru yang diolah dengan

metode KNN dan cross validation ............................................................. 51


metode KNN dan partitioning ................................................................... 51

Tabel 4.15. Confussion matrix dari dataset zenius yang diolah dengan

metode decision tree dan cross validation ................................................. 53


metode decision tree dan partitioning ....................................................... 53


metode naïve bayes dan cross validation ................................................... 56


metode naïve bayes dan partitioning ......................................................... 56


metode KNN dan cross validation ............................................................. 58


metode KNN dan partitioning ................................................................... 58

Tabel 4.21. Perbandingan nilai akurasi dari masing-masing hasil

Pengujian .................................................................................................... 59

xiii


DAFTAR GAMBAR

Gambar 3.1. Model penelitian usulan ........................................................ 26

Gambar 4.1. Contoh review positif dari pengguna aplikasi ruangguru ...... 31

Gambar 4.2. Contoh review negative dari pengguna aplikasi ruangguru .. 32

Gambar 4.3. Contoh review positif dari pengguna aplikasi zenius ............ 33

Gambar 4.4. Contoh review negative dari pengguna aplikasi zenius ........ 34

Gambar 4.5. Proses preprocessing data dengan gataframework.com ....... 36

Gambar 4.6. Proses preprocessing data dengan KNIME .......................... 36

Gambar 4.7. Model penelitian pengolahan dataset review pengguna

aplikasi ruangguru ...................................................................................... 43

Gambar 4.8. Model penelitian pengolahan dataset review pengguna

aplikasi zenius ............................................................................................ 45

Gambar 4.9. ROC curve dari algoritma decision tree untuk dataset

ruangguru dengan partitioning ................................................................... 47

Gambar 4.10. Tree view dari dataset aplikasi ruangguru ........................... 48

Gambar 4.11. ROC curve dari algoritma naïve bayes untuk dataset


Gambar 4.12. ROC curve dari algoritma KNN untuk dataset


Gambar 4.13. ROC curve dari algoritma decision tree untuk dataset

zenius dengan partitioning ......................................................................... 54

Gambar 4.14. Tree view dari dataset aplikasi zenius ................................. 55

Gambar 4.15. ROC curve dari algoritma naïve bayes untuk dataset


Gambar 4.16. ROC curve dari algoritma KNN untuk dataset


Gambar 4.17. Flowchart aplikasi analisa sentimen aplikasi pembelajaran

daring .......................................................................................................... 61

Gambar 4.18. Tampilan Halaman home aplikasi analisa sentimen

pembelajaran daring ................................................................................... 61

Gambar 4.19. Tampilan halaman testing data ............................................ 62

Gambar 4.20. Tampilan halaman hasil pengkategorian ............................. 62

Gambar 4.21. Tampilan halaman detail preprocessing ............................. 63

xiv


DAFTAR LAMPIRAN

Lampiran 1. Contoh data komentar pengguna aplikasi ruangguru ............ 68

Lampiran 2. Contoh data komentar pengguna aplikasi zenius .................. 69

Lampiran 3. Contoh preprocessing dataset ............................................... 70

ix

ix


ABSTRAK

Nama Lengkap : Recha Abriana Anggraini

NIM : 14002216




Judul Tesis : “Analisa Sentimen Terhadap Aplikasi Pembelajaran

Daring Menggunakan Algoritma Klasifikasi Data Mining”

Belajar merupakan kegiatan yang harus dilakukan makhluk hidup tanpa mengenal

batasan umur. Kegiatan belajar kini didukung oleh perkembangan teknologi yang

semakin massif sehingga mempermudah manusia. Berkat perkembangan

teknologi, muncullah berbagai alternatif metode pembelajaran seperti

pembelajaran daring. Pembelajaran daring biasanya didukung oleh berbagai

aplikasi yang disediakan diberbagai store yang dapat didownload melalui

smartphone secara gratis maupun berbayar. Salah satu store penyedia aplikasi

tersebut adalah google playstore. Banyaknya pengguna suatu aplikasi akan

memunculkan banyak penilaian yang diberikan terhadap aplikasi tersebut, baik

penilaian positif maupun negatif. Dalam penelitian ini, penulis melakukan

klasifikasi sentiment terhadap dua palikasi pembelajaran daring yang popular di

Indonesia yaitu ruangguru dan zenius dengan algoritma klasifikasi data mining.

Tahapan pengolahan data dimulai dengan preprocessing data, modelling sampai

dengan evaluasi. Dari hasil pengolahan data yang dilakukan, dapat diketahui

bahwa algoritma KNN dengan cross validation berhasil mengklasifikasikan

sentiment pengguna aplikasi tersebut dengan akurasi tertinggi.

Kata kunci: text mining, sentiment, data mining, klasifikasi, ruangguru, zenius,

pembelajaran daring.

x


ABSTRACT

Name : Recha Abriana Anggraini

NIM : 14002216

Study of Program : Ilmu Komputer

Levels : Strata Dua (S2)

Concentrations : Data Mining

Title : “Analisa Sentimen Terhadap Aplikasi Pembelajaran

Daring Menggunakan Algoritma Klasifikasi Data Mining”

Learning is an activity that must be carried out by living things without knowing

age restrictions. Learning activities now supported by increasingly massive

technological developments that make it easier. Because technological

developments, various alternative learning methods have emerged, such as online

learning. Online learning is usually supported by various applications provided in

stores that can be downloaded via smartphones for free or paid. One of the store

application providers is Google Play Store. Increasing users of an application will

bring up many ratings given to the application, both positive or negative ratings.

In this study, we conducted a sentiment classification of two popular online

learning applications in Indonesia, namely Ruangguru and Zenius with data

mining classification algorithms. Stages of data processing begins with data

preprocessing, modeling until evaluation. From the results of data processing, we

know that the KNN algorithm with cross validation has succeeded in classifying

the user application sentiments with the highest accuracy.

Keywords: text mining, sentiment, data mining, classification, ruangguru, zenius,

online learning.

1

1


BAB I

PENDAHULUAN

1.1. Latar Belakang

Pembelajaran merupakan suatu kegiatan atau system yang membantu

individu dalam berinteraksi untuk belajar terhadap lingkungan belajarnya. teori

merupakan suatu asas yang tersusun dalam kejadian-kejadian tertentu dalam dunia

nyata [9]. Saat ini kegiatan pembelajaran semakin dimudahkan berkat

perkembangan teknologi yang semakin pesat. Salah satu yang ditawarkan dalam

kemudahan tersebut adalah tersedianya berbagai aplikasi yang mendukung

aktifitas belajar yang dapat dengan udah di download melalui playstore dan di

akses melalui smartphone mulai dari yang gratis sampai dengan berbayar.

Banyaknya aplikasi-aplikasi yang ada tentu saja membuat orang semakin mudah

dalam menentukan pilihan untuk menggunakan aplikasi sesuai zona nyaman dan

juga kebutuhannya, dengan demikian maka akan bermunculan opini-opini serta

penilaian baik dan buruknya aplikasi tersebut. Proses penilaian aplikasi yang

digunakan dapat melalui berbagai cara antara lain melalui media sosial atau

playstore yang menyediakan aplikasi tersebut. Salah satu store yang menyediakan

fitur untuk menilai aplikasi tersebut adalah google playstore.

Penilaian dari konsumen sangat dibutuhkan oleh perusahaan pengembang

aplikasi untuk evaluasi serta peningkatan fitur dari aplikasi yang dibuat. Untuk

mengetahui apakah penilaian dari sebuah aplikasi cenderung positif atau negatif

maka diperlukan analisis terhadap penilaian tersebut. Salah satu analisis yang

sering dilakukan adalah analisa sentimen (sentiment analysis). Analisis Sentimen

saat ini memiliki peran penting dalam analisis media sosial dan, lebih umum,

dalam menganalisis pendapat pengguna tentang umum topik atau ulasan

pengguna tentang produk / layanan sejumlah besar aplikasi [5].

Sentimen analisis merupakan salah satu bidang dari Natural Language

Processing (NLP) yang berperan untuk membangun sistem untuk mengenali dan

mengeskstraksi opini atau pendapat atau penilaian seseorang terhadap suatu

aplikasi atau sesuatu yang terjadi di media sosial dalam bentuk teks. Penilaian

yang didapatkan oleh sebuah aplikasi melalui google playstore adalah berupa teks

2


atau opini yang ditulis oleh pengguna, opini tersebut dapat berupa review baik

ataupun buruk ataupun berupa kritik dan saran yang dapat digunakan untuk

mengembangkan aplikasi ke arah yang lebih baik sesuai dengan yang disarankan

oleh pengguna. Pengolahan data review yang didapatkan oleh aplikasi melalui

platform google playstore yang kemudian di analisa dengan analisa sentimen akan

menghasilkan kecenderungan penilaian terhadap aplikasi tersebut apakah

cenderung positif atau negatif. Hasil dari pengolahan data ini dapat dijadikan

sebagai bahan dasar evaluasi bagi pengembang aplikasi. Dalam penelitiannya

yang berjudul “Sentiment-aware Analysis of Mobile Apps User Reviews

Regarding Particular Updates” [28] menyebutkan bahwa aplikasi seluler online

kontemporer (aplikasi) pasar memungkinkan pengguna untuk meninjau aplikasi

yang mereka gunakan. Ulasan ini adalah aset penting yang mencerminkan

kebutuhan dan keluhan pengguna mengenai aplikasi tertentu, yang mencakup

berbagai aspek kualitas aplikasi seluler. Dengan menyelidiki konten ulasan

tersebut, pengembang aplikasi dapat memperoleh informasi bermanfaat yang

memandu pekerjaan pemeliharaan dan evolusi di masa depan. Selanjutnya

bersama dengan pembaruan aplikasi, ulasan yang diberikan pengguna khususnya

keluhan dan pujian tentang pembaruan tertentu.

Penelitian ini bertujuan untuk melakukan analisa terhadap opini atau

penilaian pengguna dan mengklasifikasikan opini tersebut menjadi 2 kelas yaitu

positif dan negatif menggunakan algoritma klasifikasi data mining, data yang

akan diolah adalah yang didapatkan dari google play store untuk aplikasi

pembelajaran. Aplikasi pembelajaran yang akan diteliti adalah aplikasi ruang guru

dan zenius.

1.2. Identifikasi Masalah

Opini atau pendapat pengguna aplikasi pembelajaran daring berupa negatif

maupun positif yang mereka berikan melalui platform google playstore akan

diklasifikasikan menjadi 2 kelas yaitu kelas positif dan negatif dengan

menggunakan beberapa algoritma klasifikasi data mining. Dari pengolahan data

yang dilakukan akan diketahui model klasifikasi menggunakan algoritma apa

yang menghasilkan klasifikasi sentimen dengan nilai akurasi terbaik dalam

pengklasifikasian opini yang diberikan pengguna terhadap aplikasi pembelajaran

3


serta bagaimana hasil akurasi dari tiap-tiap algoritma klasifikasi data mining

dalam mengklasifikasikan sentimen dari aplikasi pembelajaran.

1.3. Tujuan Penelitian

Tujuan dari penelitian ini adalah mengimplementasikan algoritma

klasifikasi data mining untuk mengklasifikasikan sentimen dari penilaian

pengguna aplikasi pembelajaran daring yang diperoleh dari google playstore ke

dalam 2 kelas yaitu kelas positif dan negatif menggunakan algoritma klasifikasi

data mining seperti naive bayes, K-NN, dan decision tree.

1.4. Ruang Lingkup Penelitian

Agar pokok bahasan penelitian ini tidak keluar dari fokus utama yang

dikerjakan oleh peneliti, maka peneliti memberikan batasan ruang lingkup

penelitian sebagai berikut:

1. Algoritma yang digunakan adalah algoritma klasifikasi data mining seperti

Naive Bayes, K- Nearest Neighbour (K-NN), dan Decision Tree

2. Dataset yang digunakan adalah review pengguna aplikasi ruang guru dan

zenius yang ada di google playstore

3. Atribut dari sentimen yang diklasifikasikan terdiri dari 2 atribut yaitu positif

dan negatif.

1.5. Sistematika Penulisan

Sistematika penulisan dalam tesis ini terdiri dari beberapa bab yang disusun

sebagai berikut:

BAB I PENDAHULUAN

Pada bab pendahuluan ini diuraikan fakta yang berkaitan dengan

permasalahan yang akan diteliti, mendeskripsikan mengenai latar belakang

masalah, identifikasi masalah, tujuan penelitian, ruang lingkup penelitian,

hipotesis dan sistematika penulisan.

BAB II LANDASAN/KERANGKA PEMIKIRAN

Bab ini membahas tentang landasan teoritis yang digunakan oleh peneliti

untuk menunjang penelitian yang mencakup tinjauan pustaka, tinjauan

studi dan tinjauan objek penelitian.

4


BAB III METODOLOGI PENELITIAN

Bab ini membahas tentang metode pengumpulan data yang digunakan

dalam penelitian serta membahas tentang rencana penelitian serta konsep

dari penelitian yang nantinya akan digunakan sebagai solusi penyelesaian

masalah yang diangkat dalam penelitian ini.

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

Bab ini berisi tentang analisa dan pembahasan yang dilakukan dimulai dari

pengambilan data, pengolahan data dengan algoritma Naive Bayes, K-NN,

dan Decision Tree untuk mendapatkan akurasi dari masing-masing

algoritma yang digunakan serta menjelaskan hasil penelitian dan

penerapan hasil penelitian.

BAB V PENUTUP

Bab ini berisi tentang kesimpulan dari pembahasan pada bab-bab

sebelumnya dan saran untuk penelitian selanjutnya.

5

5


BAB II

LANDASAN TEORI

2.1. Tinjauan Pustaka

Dalam penyusunan laporan ini, penulis melakukan beberapa tinjauan

pustaka dan literatur-literatur lain yang berhubungan dengan konsep penelitian

untuk mengklasifikasikan sentimen. Tinjauan pustaka ini meliputi beberapa hal

seperti:

2.1.1. Sentiment analysis

Sentiment analysis adalah proses analisis dari berbagai data berupa

pandangan atau opini sehingga dihasilkan kesimpulan dari berbagai opini yang

ada, hasil dari sentiment analysis dapat berupa persentase sentimen positif,

negatif, atau netral. Beberapa pengguna juga menginginkan keluaran yang

dihasilkan berupa representasi visual dari data teks atau nama lainnya word plot

[10].

Sentiment analysis (SA) atau Opinion mining (OM) adalah studi

komputasi atas pendapat, sikap, dan emosi orang terhadap suatu entitas. Entitas

dapat mewakili individu, acara, atau topik. Opinion mining bertugas untuk

mengekstraksi dan menganalisis pendapat orang tentang suatu entitas, sementara

Sentiment Analysis adalah untuk mengidentifikasi sentimen yang diungkapkan

dalam suatu teks lalu menganalisisnya. Oleh karena itu, tujuan utama dari

Sentiment Analysis adalah untuk menemukan pendapat, mengidentifikasi

sentimen yang diungkapkan, dan kemudian mengklasifikasikan polaritasnya

(positif, negatif, ataupun netral) [16].

2.1.2. Data mining

Writen, Ian H. Frank (2011) menyatakan bahwa data mining adalah proses

ekstraksi suatu data (sebelumnya tidak diketahui, bersifat implisit, dan dianggap

tidak berguna) menjadi informasi atau pengetahuan atau pola dari data yang

jumlahnya besar [7].

Secara umum terdapat 5 (lima) peranan dalam data mining, yaitu estimasi,

prediksi, klasifikasi, clustering dan asosiasi. Tabel 2.1 menunjukkan perbedaan

masing-masing peranan data mining.

6


Tabel 2.1. Perbedaan Peranan Data Mining

Jenis Attribute/Feature Kelas/Label/Target Keterangan

Estimasi Numerik Numerik

Prediksi Numerik Numerik Rentang

Waktu

Klasifikasi Numerik/Kategorial Numerik/Kategorial

Clustering Numerik -

Asosiasi - - Hubungan

antar attribute.

Sumber: Suntoro, 2019

2.1.3. Text mining

Masalah analisis teks umumnya terdiri dari tiga kritikal muka: penguraian,

pencarian dan pengambilan, dan penambangan teks. Penambangan teks mencakup

penambangan melalui rekaman konten atau aset untuk mendapatkan data

terorganisir yang signifikan. Ini membutuhkan alat logis modern yang memproses

pesan sehingga kumpulkan slogannya atau informasi utama fokus dari apa yang

dianggap umumnya mentah atau format tidak terstruktur. Dalam penambangan

teks, dibangun kerangka kerja memanfaatkan hal-hal seperti kategorisasi ilmiah

dan leksikal investigasi untuk mencari tahu bagian mana dari laporan konten

penting sebagai informasi yang ditambang [24]

Text mining, yang juga disebut sebagai Teks Data Mining (TDM) atau

Knowledge Discovery in Text (KDT), secara umum mengacu pada proses

ekstraksi informasi dari dokumen-dokumen teks tak terstruktur (unstructured).

Text mining dapat didefinisikan sebagai penemuan informasi baru dan tidak

diketahui sebelumnya oleh komputer, yang secara otomatis mengekstrak

informasi dari sumber-sumber teks tak terstruktur yang berbeda. Kunci dari proses

ini adalah menggabungkan informasi yang berhasil diekstraksi dari berbagai

sumber [25a].

Ada empat tahap proses pokok dalam text mining, yaitu pemrosesan awal

terhadap teks (text preprocessing), transformasi teks (text transformation),

pemilihan fitur (feature selection), dan penemuan pola (pattern discovery) [25b].

1. Text Preprocessing

Tahap ini melakukan analisis semantik (kebenaran arti) dan sintaktik

(kebenaran susunan) terhadap teks. Tujuan dari pemrosesan awal adalah untuk

mempersiapkan teks menjadi data yang akan mengalami pengolahan lebih lanjut.

7


Operasi yang dapat dilakukan pada tahap ini meliputi part-of-speech (PoS)

tagging, menghasilkan parse tree untuk tiap-tiap kalimat, dan pembersihan teks.

Teknik yang biasa dilakukan dalam penelitian di Indonesia pada tahap

preprocessing antara lain [25c]:

a. Annotation removal bertujuan untuk menghapus dan menghilangkan

karakter yang dianggap tidak perlu dan tidak penting.

b. Regex filter digunakan untuk mencocokan string teks, seperti karakter

tertentu, kata-kata, atau pola karakter dan mengelompokkannya.

c. Remove emoticon digunakan untuk mengkonversi bahkan menghilangkan

simbol emoticon.

d. Indonesian Stemming digunakan untuk mencari kata dasar dari kata-kata

berbahaa Indonesia.

e. Transformation Not prosesnya tidak menghapus kata melainkan

mengambil untuk menilai bahwa kalimat yang diproses mengandung

kalimat negatif. Selanjutnya akan ditambahkan ke sebuah variabel yang

sudah ditentukan untuk dihitung. Misalnya kasus sentimen analisis yang

membutuhkan penilaian pada kalimat positif dan negatif.

f. Stopword removal biasanya digunakan untuk menghilangkan kalimat

tidak penting seperti kata penghubung.

g. Punctuation bertujuan menghapus semua karakter non alphabet misalnya

simbol, spasi dan lain-lain.

h. N-chars filter berfungsi untuk menetapkan batasan minimal karakter yang

dimiliki oleh sebuah kata.

2. Text Transformation

Transformasi teks atau pembentukan atribut mengacu pada proses untuk

mendapatkan representasi dokumen yang diharapkan. Pendekatan representasi

dokumen yang lazim digunakan oleh model “bag of words” dan model ruang

vector (vector space model). Transformasi teks sekaligus juga melakukan

pengubahan kata-kata ke bentuk dasarnya dan pengurangan dimensi kata di dalam

dokumen. Tindakan ini diwujudkan dengan menerapkan stemming dan

menghapus stop words.

8


3. Feature Selection

Pemilihan fitur (kata) merupakan tahap lanjut dari pengurangan dimensi pada

proses transformasi teks. Walaupun tahap sebelumnya sudah melakukan

penghapusan kata-kata yang tidak deskriptif (stopwords), namun tidak semua

kata-kata di dalam dokumen memiliki arti penting. Oleh karena itu, untuk

mengurangi dimensi, pemilihan hanya dilakukan terhadap kata-kata yang relevan

yang benar-benar merepresentasikan isi dari suatu dokumen. Ide dasar dari

pemilihan fitur adalah menghapus kata-kata yang kemunculannya di suatu

dokumen terlalu sedikit atau terlalu banyak. Algoritma yang digunakan pada text

mining, biasanya tidak hanya melakukan perhitungan pada dokumen saja, tetapi

juga pada feature . Empat macam feature yang sering digunakan:

a. Character, merupakan komponan individual, bisa huruf, angka, karakter

spesial dan spasi, merupakan block pembangun pada level paling tinggi

pembentuk semantik feature, seperti kata, term dan concept. Pada

umumnya, representasi character-based ini jarang digunakan pada

beberapa teknik pemrosesan teks.

b. Words.

c. Terms merupakan single word dan multiword phrase yang terpilih secara

langsung dari corpus. Representasi term-based dari dokumen tersusun dari

subset term dalam dokumen.

d. Concept, merupakan feature yang di-generate dari sebuah dokumen secara

manual, rule-based, atau metodologi lain.

e. Pattern Discovery

Pattern discovery merupakan tahap penting untuk menemukan pola atau

pengetahuan (knowledge) dari keseluruhan teks. Tindakan yang lazim

dilakukan pada tahap ini adalah operasi text mining, dan biasanya

menggunakan teknik-teknik data mining. Dalam penemuan pola ini, proses

text mining dikombinasikan dengan proses-proses data mining. Masukan

awal dari proses text mining adalah suatu data teks dan menghasilkan

keluaran berupa pola sebagai hasil interpretasi atau evaluasi. Apabila hasil

keluaran dari penemuan pola belum sesuai untuk aplikasi, dilanjutkan

evaluasi dengan melakukan iterasi ke satu atau beberapa tahap

9


sebelumnya. Sebaliknya, hasil interpretasi merupakan tahap akhir dari

proses text mining dan akan disajikan ke pengguna dalam bentuk visual.

4. Ekstraksi Dokumen

Teks yang akan dilakukan proses text mining, pada umumnya memiliki

beberapa karakteristik diantaranya adalah memiliki dimensi yang tinggi, terdapat

noise pada data, dan terdapat struktur teks yang tidak baik. Cara yang digunakan

dalam mempelajari suatu data teks, adalah dengan terlebih dahulu menentukan

fitur-fitur yang mewakili setiap kata untuk setiap fitur yang ada pada dokumen.

Sebelum menentukan fitur-fitur yang mewakili, diperlukan tahap preprocessing

yang dilakukan secara umum dalam teks mining pada dokumen, yaitu case

folding, tokenizing, filtering, stemming, tagging dan analyzing.

a. Case folding dan Tokenizing

Case folding adalah mengubah semua huruf dalam dokumen menjadi

huruf kecil. Hanya huruf “a” sampai dengan “z” yang diterima. Karakter selain

huruf dihilangkan dan dianggap delimiter. Tahap tokenizing / parsing adalah

tahap pemotongan string input berdasarkan tiap kata yang menyusunnya.

b. Filtering

Filtering adalah tahap mengambil kata-kata penting dari hasil token. Bisa

menggunakan algoritma stoplist (membuang kata yang kurang penting) atau

wordlist (menyimpan kata penting). Stoplist/stopword adalah kata-kata yang

tidak deskriptif yang dapat dibuang dalam pendekatan bag-of-words. Contoh

stopwords adalah “yang”, “dan”, “di”, “dari”, dan seterusnya.

c. Stemming

Tahap stemming adalah tahap mencari root kata dari tiap kata hasil

filtering. Pada tahap ini dilakukan proses pengembalian berbagai bentukan kata

ke dalam suatu representasi yang sama. Tahap ini kebanyakan dipakai untuk

teks berbahasa Inggris dan lebih sulit diterapkan pada teks berbahasa

Indonesia. Hal ini dikarenakan bahasa Indonesia tidak memiliki rumus bentuk

baku yang permanen. Stemming merupakan suatu proses yang terdapat dalam

sistem IR yang mentransformasi kata-kata yang terdapat dalam suatu dokumen

ke kata-kata akarnya (root word) dengan menggunakan aturan-aturan tertentu.

Sebagai contoh, kata bersama, kebersamaan, menyamai, akan distem ke root

wordnya yaitu “sama”. Proses stemming pada teks berbahasa Indonesia

10


berbeda dengan stemming pada teks berbahasa Inggris. Pada teks berbahasa

Inggris, proses yang diperlukan hanya proses menghilangkan sufiks.

Sedangkan pada teks berbahasa Indonesia, selain sufiks, prefiks, dan konfiks

juga dihilangkan.

2.1.4. Aplikasi Mobile

Aplikasi Mobile adalah perangkat lunak yang berjalan pada perangkat

mobile seperti smartphone atau tablet PC. Aplikasi Mobile juga dikenal sebagai

aplikasi yang dapat diunduh dan memiliki fungsi tertentu sehingga menambah

fungsionalitas dari perangkat mobile itu sendiri. Untuk mendapatkan mobile

application yang diinginkan, user dapat mengunduhnya melalui situs tertentu

sesuai dengan sistem operasi yang dimiliki. Google Play dan iTunes merupakan

beberapa contoh dari situs yang menyediakan beragam aplikasi bagi pengguna

Android dan iOS untuk mengunduh aplikasi yang diinginkan [14].

2.1.5. Ruang Guru

PT Ruang Raya Indonesia (Ruangguru) adalah perseroan terbatas yang

bergerak di bidang pendidikan nonformal yang didirikan menurut dan berdasarkan

hukum yang berlaku di Indonesia serta telah memperoleh Izin Pendirian Satuan

Pendidikan Nonformal dan Izin Operasional Lembaga Kursus Pelatihan dengan

Nomor 3/A.5a/31.74.01/-1.851.332/2018. Ruangguru merupakan perusahaan

teknologi terbesar di Indonesia yang berfokus pada layanan berbasis pendidikan.

Kami telah memiliki lebih dari 15 juta pengguna serta mengelola 300.000 guru

yang menawarkan jasa di lebih dari 100 bidang pelajaran. Ruangguru

mengembangkan berbagai layanan belajar berbasis teknologi, termasuk layanan

kelas virtual, platform ujian online, video belajar berlangganan, marketplace les

privat, serta konten-konten pendidikan lainnya yang bisa diakses melalui web dan

aplikasi Ruangguru. Ruangguru juga telah dipercaya untuk bermitra dengan 32

(dari 34) Pemerintah Provinsi dan 326 Pemerintah Kota dan Kabupaten di

Indonesia. Ruangguru juga telah memenangkan sejumlah penghargaan di dalam

dan luar negeri, termasuk Solver of MIT, Atlassian Prize, UNICEF Innovation to

Watch,Google Launchpad Accelerator, dan ITU Global Industry Award.

Perusahaan ini didirikan sejak tahun 2014 oleh Belva Devara dan Iman Usman,

yang keduanya berhasil masuk dalam jajaran pengusaha sukses di bawah 30 tahun

11


melalui Forbes 30 under 30 untuk sektor teknologi konsumen di Asia. Di tahun

2019, mereka mendapat penghargaan sebagai Emerging Entrepreneur dari Ernst

& Young [18].

2.1.6. Zenius

Zenius adalah pelopor startup teknologi pendidikan di Indonesia. Zenius

memproduksi konten pendidikan untuk semua level pendidikan dari SD, SMP,

dan SMA beserta persiapan ujian nasional dan tes masuk perguruan tinggi. Sejak

tahun 2004, Zenius mempunyai visi untuk membentuk Indonesia yang cerdas dan

cerah. Kami memulai perjalanan kami pada tahun 2008 dengan produk CD/DVD,

sebelum beralih ke website zenius.net pada tahun 2010. Hingga sekarang kami

berhasil meluncurkan mobile apps yang bisa diungguh melalui iOS dan Android.

Sekarang, Zenius telah memiliki lebih dari 74,000 video pembelajaran dan

puluhan ribu latihan soal [30].

2.1.7. Naïve Bayes

Naive Bayes (NB) adalah sebuah metode klasifikasi sederhana yang

mengaplikasikan teorema Bayes. Dalam perhitungan probabilitas, NB

mengasumsikan bahwa nilai atribut suatu kelas tidak memiliki keterkaitan dengan

keberadaan atribut dikelas lain. Meski dalam kenyataanya setiap atribut hampir

dipastikan memiliki ketergantungan dengan atribut lain, namun dengan asumsi

naif seperti ini membuat Naive Bayes mudah dalam perhitungan [1]. Pada

algoritma NB, sejumlah petunjuk yang disebut atribut diperlukan untuk membantu

membentuk kelas yang sesuai untuk sampel dianalisis, di mana kehadiran fitur-

fitur tertentu dalam kelas tidak terkait dengan fitur lainnya [19]

Metode pengklasifikasian dengan menggunakan metode probabilitas dan

statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu

memprediksi peluang di masa depan berdasarkan pengalaman di masa

sebelumnya sehingga dikenal sebagai teori Bayes [2]. Formula umum teorema

Bayes:

P(C|E) =P(E|C)P(C)

P(E)…………………… . . (2.5)

12


Keterangan:

a. P(C|E) : Probabilitas akhir bersyarat (conditional probability) suatu

hipotesis C terjadi jika diberikan bukti (evidence) E terjadi.

b. P(E|C) : Probabilitas sebuah bukti E terjadi akan memengaruhi hipotesis

C.

c. P(C) : Probabilitas awal (priori) hipotesis C terjadi tanpa memandang

bukti apapun.

d. P(E) : Probabilitas awal (priori) bukti E terjadi tanpa memandang

hipotesis/bukti yang lain.

2.1.8. K-Nearest Neighbour (K-NN)

Algoritma K-Nearest Neighbour (KNN) adalah algoritma

pengklasifikasian data sederhana dimana penghitungan jarak terpendek dijadikan

ukuran untuk mengklasifikasikan suatu kasus baru berdasarkan ukuran kemiripan.

Algoritma KNN tergolong dalam algoritma supervised yaitu proses pembentukan

algoritma diperoleh melalui proses pembelajaran (learning) pada record-record

lama yang sudah terklasifikasi dan hasil pembelajaran tersebut dipakai untuk

mengklasifikasikan record baru dengan output yang belum diketahui [17]. Metode

pembelajaran berbasis instance ditentukan oleh tiga sifat sebagai berikut:

1. Menyimpan semua data pelatihan selama proses pembelajaran.

2. Generalisasi diluar data pelatihan ditunda sampai nilai diprediksi untuk kasus

baru, karena setiap pertanyaan baru dijawab dengan membandingkan kasus

baru dengan data pelatihan.

3. Dari data pelatihan KNN mencari kasus yang mirip dengan kasus baru. Dalam

K-Nearest Neighbours setiap instance didefinisikan oleh sejumlah atribut dan

semua instance di dalam data diwakili oleh jumlah atribut yang sama,

meskipun mungkin ada beberapa nilai atribut yang hilang. Salah satu atribut

ini disebut atribut kelas yang berisi nilai kelas (label) dari data, yang nilainya

diperkirakan untuk instance baru yang tidak terlihat.

Aturan 1-NN mengasumsikan nilai tetangga terdekat menjadi kelas dari

instance baru. K dapat berupa sejumlah tetangganya, K = 1, 2, 3, 4,…, n, dimana

n adalah jumlah kasus. Kedekatan tetangga didefinisikan berdasarkan atribut yang

mendefinisikan instance baru dan instance pelatihan. Instance pelatihan yang nilai

13


atributnya mirip dengan instance baru dianggap sebagai yang terdekat, tetapi

sering kali instance serupa persis tidak ditemukan, jadi instance terdekat adalah

yang paling tidak memiliki perbedaan [13].

2.1.9. Decision Tree

Metode pohon keputusan mengubah fakta yang sangat besar menjadi

pohon keputusan yang merepresentasikan rules [29]. Kelebihan dari metode

pohon keputusan adalah:

1. Daerah pengambilan keputusan yang sebelumnya kompleks dan sangat

global, dapat diubah menjadi lebih simpel dan spesifik

2. Eliminasi perhitungan-perhitungan yang tidak diperlukan, karena ketika

menggunakan metode pohon keputusan maka sampel diuji hanya berdasarkan

kriteria atau kelas tertentu

3. Fleksibel untuk memilih fitur dari node internalyang berbeda, fitur yang

terpilih akan membedakan suatu kriteria dibandingkan kriteria yang lain

dalam node yang sama. Kefleksibelan metode pohon keputusan ini

meningkatkan kualitas keputusan yang dihasilkan jika dibandingkan ketika

menggunakan metode penghitungan satu tahap yang lebih konvensional

2.1.10. Knime

Platform KNIME Analytics adalah perangkat lunak sumber terbuka untuk

membuat aplikasi dan layanan ilmu data. Intuitif, terbuka, dan terus menerus

mengintegrasikan pengembangan baru, KNIME membuat pemahaman data dan

merancang alur kerja ilmu data dan komponen yang dapat digunakan kembali

dapat diakses oleh semua orang. Dengan Platform Analisis KNIME, Anda dapat

membuat alur kerja visual dengan antarmuka grafis gaya intuitif, seret dan lepas,

tanpa perlu pengkodean [8].

2.1.11. Webharvy

WebHarvy dapat dengan mudah mengekstraksi Teks, HTML, Gambar,

URL & Email dari situs web, dan menyimpan konten yang diekstraksi dalam

berbagai format. Webharvy sangat mudah digunakan, mulai mengumpulkan data

dalam hitungan menit, mendukung semua jenis situs web. Menangani login,

pengiriman formulir, dll. Ekstrak data dari banyak halaman, kategori & kata

14


kunci. Penjadwal built-in, dukungan Proxy / VPN, Smart Help dan banyak lagi

[27].

2.1.12. Gataframework

Pada tahun 2018, seseorang bernama Windu Gata mengembangkan

aplikasi berbasis web untuk pra-pemrosesan text mining seperti Indonesian

stopwords, Indonesian stemming, Indonesian Acronym, Indonesian Slank dan

lainnya dimaksudkan untuk membantu peneliti dalam melakukan penelitian di

bidang penambangan teks bahasa Indonesia. Aplikasi ini dibangun menggunakan

kerangka kerja yang disebut kerangka kerja GATA

(http://www.gataframework.com). Aplikasi ini merupakan alternatif dalam teks

pra-pemrosesan Indonesia, aplikasi juga menyediakan fitur antarmuka program

aplikasi (API) untuk mengirim data dari aplikasi eksternal [21].

2.2. Tinjauan studi (Penelitian terkait)

Penelitian mengenai analisa sentimen telah lama dilakukan dan hasil dari

penelitian tersebut juga telah banyak yang dipublikasikan. Tinjauan studi terhadap

penelitian sebelumnya dilakukan untuk dapat mengetahui metode, data, dan juga

model penelitian yang sudah pernah dilakukan. Tinjauan studi yang mendukung

penelitian ini sebagai berikut:

Tabel 2.2. Rangkuman penelitian terkait

Peneliti Dataset Masalah Metode Hasil

Muhammad

Romy

Firdaus, Fikri

Muhammad

Rizki, Favian

Muhammad

Gaus, Indra

Kusumajati

Susanto

(2020)

Data

komentar

pengguna

ruang guru

yang diambil

dari

youtube.com

Kepuasan

pelanggan adalah

evaluasi pasca

pemakaian produk.

Kepuasan

pelanggan

mewakili suatu

fokus strategi

terpusat untuk

perusahaan yang

berorientasi

pelanggan

diberbagai industri.

Sentimen dari

komentar yang

diberikan

pelanggan terhadap

suatu produk dapat

mencerminkan

Sentiment

analysis

Hasil dari

penerapan

metode

tersebut

menunjukka

n respon di

komentar

YouTube

terhadap

fitur

ruangbelajar

dari

Ruangguru

kebanyakan

pengguna

memberikan

respon

dengan

sentimen

15



seberapa puasnya

pelanggan terhadap

produk tersebut.

positif

Sitaresmi

Wahyu

Handani,

Dhanar Intan

Surya

Saputra,

Hasirun,

Rizky Mega

Arino, Gita

Fiza Asyrofi

Ramadhan

(2019)

Data

komentar

pengguna

aplikasi Go-

Jek yang ada

di google

playstore.

Go-Jek merupakan

salah satu aplikasi

transportasi yang

popular sehingga

untuk menjaga

kepercayaan

pelanggan, perlu

adanya

peningkatan

layanannya.

Naïve Bayes

Classifier

Penelitian

ini

menunjukka

n hasil

kepuasan

pengguna

yang

dilakukan

pada akhir

tahun, di

mana hasil

negatif

dapat terjadi

karena

banyak

aspek selain

aspek

layanan

GoJek.

Babatunde

Olabenjo

(2016)

Dataset yang

digunakan

dalam proyek

ini adalah

metadata dari

1.197.995

dari

1.390.545

aplikasi

setelah

menyaring

data buruk.

Dataset ini

adalah file

CSV yang

berisi aplikasi

yang

diekstrak dari

Google Play

Store pada

Juni 2015

dengan

GooglePlaySt

oreCrawler5.

Ada lebih dari satu

juta aplikasi di

Google Play Store

dan lebih dari

setengah juta

penerbit. Memiliki

sejumlah besar

aplikasi dan

pengembang dapat

menimbulkan

tantangan bagi

pengguna aplikasi

dan penerbit baru

di playstore.

Naïve Bayes

Classifier

hasil

penelitian

dapat

diketahui

bahwa

algoritma

Naive

Bayes

Classifier

berkinerja

baik dan

menghasilk

an nilai

akurasi 87%

Deni Data opini Opini masyarakat Naive Bayes Dari hasil

16



Rusdiaman

dan Didi

Rosiyadi

(2019)

publik

mengenai

tokoh

masyarakat

yang

dilontarkan

melalui

media sosial

twitter

terhadap tokoh

publik sangat

mudah tersebar

melalui media

sosial, opini

tersebut dapat

berupa opini

negatif ataupun

positif, semakin

hari opini tersebut

semakin banyak

dan tentunya

menjadi sebuah

data yang jika

diolah dapat

menghasilkan

informasi yang

berguna dimasa

depan.

Classifier

Support

Vector

Machine

pengolahan

data dengan

metode

tersebut

dapat

diperoleh

nilai akurasi

sebesar

73.96%

untuk

metode

Support

Vector

Machine

dan 71.94%

untuk

metode

Naive Bayes

Classifier.

Elly

Indrayuni

dan

Mochamad

Wahyudi

(2015)

Data review

hotel diambil

dari situs

www.tripadvi

sor.com

Pada saat liburan.

hotel merupakan

salah satu produk

pariwisata yang

sangat penting

untuk

dipertimbangkan

baik dari segi

fasilitas, pelayanan

ataupun jarak

tempuh perjalanan

wisata, Sebelum

memutuskan untuk

menentukan hotel

untuk menginap

sebaiknya

wisatawan

mengetahui dengan

detail informasi

mengenai hotel

tersebut, hal ini

dapat diperoleh

dengan membaca

opini atau hasil

review dari

pengalaman

wisatawan lain

yang tentunya

Naive Bayes

Classifier

Hasil

penelitian

menunjukka

n

peningkatan

akurasi 2%

untuk

algoritma

Naive

Bayes dari

82,67%

menjadi

84,67%

setelah

penerapan

fitur

character n-

gram.

http://www.tripadvisor.com/

http://www.tripadvisor.com/

17



membutuhkan

waktu yang cukup

lama.

Suwanda

Aditya

Saputra, Didi

Rosiyadi,

Windu Gata,

Syepri

Maulana

Husain

(2019)

Data diambil

dari google

play dari

ulasan

pengguna e-

wallet

Layanan e-wallet

saat ini umum

digunakan banyak

orang terutama

mereka yang

berada dalam usia

produktif. Alasan

utama mereka

menggunakan e-

wallet adalah

karena praktis.

Mereka tidak perlu

menyiapkan uang

tunai saat

bertransaksi.

Sedangkan bagi

penjual, mereka

tidak perlu repot

menyediakan

kembalian karena

pembayaran pasti

dilakukan dengan

nominal yang

sesuai dan

beberapa layanan

e-wallet di

Indonesia yang

muncul dalam

bentuk mobile

wallet atau aplikasi

sehingga

bermunculan

berbagai macam

penilaian terhadap

aplikasi e-wallet

tersebut.

Naive Bayes

Classifier

Hasil dari

cross

validation

NB tanpa

FS adalah

82.30 %

untuk

accuracy

dan 0.780

untuk AUC.

Sedangkan

untuk NB

dengan FS

adalah

83.60 %

untuk

accuracy

dan 0.801

untuk AUC.

Peningkatan

sangat

signifikan

dengan

penggunaan

Feature

Selection

Lutfi Budi

Ilmawan dan

Edi Winarko

(2015)

Ulasan

tekstual

aplikasi pada

Google Play

yang

dilakukan

untuk menilai

perangkat

Google dalam

application store-

nya, Google Play,

saat ini telah

menyediakan

sekitar

1.200.000 aplikasi

mobile. Dengan

Naive Bayes

Classifier

dan Support

Vector

Machine

Hasil dari

klasifikasi

menggunak

an

algoritma

Naive Bayes

menunjukka

n nilai

18



mobile sejumlah aplikasi

tersebut membuat

pengguna memiliki

banyak pilihan.

Selain itu,

pengembang

aplikasi mengalami

kesulitan dalam

mencari tahu

bagaimana

meningkatkan

kinerja aplikasinya.

akurasi

sebesar

83.87%

sedangkan

nilai akurasi

yang

ditunjukkan

oleh

algoritma

Support

Vector

Machine

sebesar

89.49%.

Vibhor

Singh,

Priyansh

Saxena,

Siddharth

Singh and S.

Rajendran

(2017)

Data review

film yang

diambil dari

tiga sumber

yang berbeda

yaitu situs

web pribadi

peneliti,

flixster, dan

twitter

Ulasan pelanggan

penting untuk

berbagai bidang

(mis. Film, Produk,

Layanan). Tinjauan

film

memainkan peran

vital dalam

menggambarkan

keberhasilan dan

kegagalannya.

Orang-orang

sekarang menjadi

sangat spesifik

tentang film apa

yang akan ditonton

dan yang tidak

boleh ditonton.

Karenanya orang

tidak ingin

membuang waktu

untuk film yang

ulasannya buruk.

Saat ini ulasan

online penting

untuk rekomendasi

pribadi.

Naive Bayes,

Decision

tree, K-NN

Hasil dari

pengolahan

data yang

telah

dilakukan

menunjukka

n nilai

akurasi dari

algoritma

Naive Bayes

sebesar

54.10%, K-

NN sebesar

50.28%,

dan

Decision

Tree

sebesar

40.26%.

Sucitra

Sahara dan

Rizqi Agung

Permana

(2019)

Dataset yang

digunakan

adalah data

komentar

masyarakat

Aplikasi game

berbasis android

ataupun ios kini

sudah merambah ke

semua pengguna

K-Nearest

Neighbour

Hasil

pengklasifik

asian

menggunak

an metode

19



yang telah

menggunaka

n aplikasi

games anak

yang ada

pada kolom

komentar

website

penyedia

aplikasi.

smartphone mulai

dari dewasa remaja

sampai anak-anak,

maka dari itu para

vendor aplikasi

maupun pihak

pebisnis berlomba

menciptakan

aplikasi guna

meraup

keuntungan, mulai

kualitas dan

performa tinggi

sampai kualitas

yang masih sering

diragukan

khususnya pada

pengguna aplikasi

game anak dibawah

umur yang

membuat orang tua

khawatir dengan

yang di konsumsi

anaknya

K-NN

menunjukka

n nilai

akurasi

sebesar

78.50%.

Lopamudra

Dey, Sanjay

Chakraborty,

Anuraag

Biswas,

Beepa Bose,

dan Sweta

Tiwari

(2016)

Data review

film dari situs

www.imdb.c

om dan data

review hotel

yang diunduh

dari

OpinRank

Review

Dataset

(http://archiv

e.ics.uci.edu/

ml/datasets/O

pinRan

k+Review+D

ataset)

The

Kemunculan Web

2.0 telah

menyebabkan

peningkatan jumlah

konten sentimental

yang tersedia di

Web. Konten

semacam itu sering

ditemukan di situs

web media sosial

dalam bentuk

ulasan film atau

produk, komentar

pengguna,

testimoni, pesan di

forum diskusi, dll.

Penemuan tepat

waktu atas konten

web yang

sentimental atau

berargumentasi

memiliki sejumlah

keunggulan, yang

K-Nearest

Neighbour

dan Naive

Bayes

Nilai

akurasi dari

review film

menggunak

an

algoritma

Naive Bayes

sebesar

82.43% dan

K-NN

sebesar

69.81%.

Sedangkan

nilai akurasi

dari review

hotel

dengan

metode

Naive Bayes

menghasilk

an nilai

akurasi

sebesar

http://www.imdb.com/

http://www.imdb.com/

20



terpenting dari pada

mencari sebuah

keuntungan dan

omset semata

55.09% dan

K-NN

sebesar

52.14%.

2.2.1. Penelitian Muhammad Romy Firdaus, Fikri Muhammad Rizki, Favian

Muhammad Gaus, Indra Kusumajati Susanto (2020)

Penelitian ini bertujuan untuk mengetahui dan menganalisis tanggapan

mengenai kepuasan pelanggan aplikasi ruangguru terhadap fitur ruangbelajar

dalam aplikasi ruangguru pada setiap jenjang pendidikan. Hal ini berguna untuk

mengetahui kekuatan dan kelemahan dari aplikasi ruangguru berdasarkan respon

sentimen dari pengguna ruangguru. Dataset yang digunakan dalam penelitian ini

adalah data komentar para pengguna aplikasi ruang guru yang ada di

youtube.com.

Untuk melihat bagaimana tingkat kepuasan dari pelanggan, digunakan

metode analisis sentimen dan juga topic modelling dalam pengolahan datanya

agar dapat dilihat respon seperti apa yang diberikan oleh pelanggan sehingga

dapat menjadi evaluasi bagi aplikasi ruangguru.

Hasil dari penerapan metode tersebut menunjukkan respon di komentar

YouTube terhadap fitur ruangbelajar dari Ruangguru kebanyakan pengguna

memberikan respon dengan sentimen positif, ini berarti para penggunanya merasa

puas dengan fitur ruangbelajar yang diberikan oleh ruangguru, dimana pengguna

yang memberikan respon dengan sentimen positif [15]

2.2.2. Penelitian Sitaresmi Wahyu Handani, Dhanar Intan Surya Saputra,

Hasirun, Rizky Mega Arino, Gita Fiza Asyrofi Ramadhan (2019)

Penelitian ini bertujuan untuk mengukur tingkat sentimen hasil analisis

yang diberikan oleh pelanggan kepada Go-Jek melalui kolom komentar di Play

Store. Pendapat pelanggan diambil untuk mendapatkan komentar positif, negatif

atau netral.

Proses analisis sentiment terdiri dari pengidentifikasian data, dilakukan

tahap praprocessing, mengklasifikasikan semua data menggunakan metode Naïve

Bayes kemudian hasil klasifikasi diurutkan sesuai dengan jenis yang telah

ditentukan. Hasil penelitian yang dilakukan pada akhir 2017 (November dan

21


Desember), dan memperoleh hasil berupa sentimen negatif setelah dilakukan

perhitungan Vmap terhadap data. Penelitian ini menunjukkan hasil kepuasan

pengguna yang dilakukan pada akhir tahun, di mana hasil negatif dapat terjadi

karena banyak aspek selain aspek layanan GoJek [23].

2.2.3. Penelitian Babatunde Olabenjo (2016)

Penelitian ini bertujuan untuk mengklasifikasikan kategori yang pada

aplikasi yang ada di google playstore. Dikarenakan aplikasi di google playstore

sangat banyak dan kategori aplikasinya hampir lebih dari 41 kategori, hal ini

menjadi tantangan tersendiri bagi pengembang aplikasi untuk menentukan

kategori yang tepat bagi aplikasi terbaru mereka, karena jika salah dalam memilih

kategori dapat berakibat mengurangi penghasilan.

Dalam penelitian ini, peneliti membangun 2 variasi Naive Bayes Classifier

menggunakan metadata open source dari google playstore untuk

mengklasifikasikan kategori aplikasi terbaru. Klasifikasi ini kemudian dievaluasi

menggunakan berbagai evaluasi metode dan hasilnya dibandingkan satu sama

lain. Dari hasil perbandingan tersebut dapat diketahui bahwa algoritma Naive

Bayes Classifier berkinerja baik danmenghasilkan nilai akurasi 87% untuk

masalah klasifikasi ini dan berpotensi mengotomatiskan kategorisasi aplikasi

untuk penerbit aplikasi android di google playstore [3].

2.2.4. Penelitian Deni Rusdiaman dan Didi Rosiyadi (2016)

Penelitian ini melakukan analisa sentimen terhadap tokoh publik yang

diungkapkan masyarakat melalui jejaring sosial twitter. Tahapan yang dilakukan

dalam penelitian ini diantaranya adalah pengumpulan data menggunakan API

Twitter, memberikan label kepada setiap twit secara manual, Pre Processing Data

dan POS Tagging. Untuk medapatkan nilai akurasi dari proses analisa yang

dilakukan, penelitian ini menggunakan metode Naive Bayes Classifier dan

Support Vector Machine. Dari hasil pengolahan data dengan metode tersebut

dapat diperoleh nilai akurasi sebesar 73.96% untuk metode Support Vector

Machine dan 71.94% untuk metode Naive Bayes Classifier [4].

2.2.5. Penelitian Elly Indrayuni dan Mochamad Wahyudi (2015)

Penelitian ini bertujuan untuk membuktikan pengaruh penerapan character

n-gram pada tahap preprocessing berdasarkan tingkat akurasi yang dihasilkan

22


dalam mengklasifikasikan analisa sentimen review hotel menggunakan algoritma

Naive Bayes. Penerapan fitur n-gram karakter pada penelitian ini diharapkan dapat

meningkatkan nilai akurasi metode. N-gram dianggap mengurangi perbedaan

antara klasifikasi kelas positif dan negatif sehingga dapat meningkatkan akurasi

rata-rata akhir suatu algoritma.

Hasil klasifikasi sentimen dalam penelitian ini terdiri dari dua kelas label,

yaitu positif dan negatif. Keakuratan nilai yang dihasilkan akan menjadi patokan

untuk menemukan model uji terbaik untuk kasus klasifikasi sentimen. Evaluasi

dilakukan dengan menggunakan K-fold cross validation dengan jumlah fold 10.

Akurasi pengukuran diukur dengan matriks kebingungan dan kurva ROC. Hasil

penelitian menunjukkan peningkatan akurasi 2% untuk algoritma Naive Bayes

dari 82,67% menjadi 84,67% setelah penerapan fitur character n-gram [6].

2.2.6. Penelitian Suwanda Aditya Saputra, Didi Rosiyadi, Windu Gata, Syepri

Maulana Husain (2019)

Penelitian ini bertujuan untuk mengklasifikasikan penilaian pengguna

terhadap aplikasi e-wallet kedalam kelas positif dan negatif. Aplikasi e-wallet

yang digunakan dalam penelitian ini adalah OVO dimana penilaian penggunanya

yang akan diteliti diambil dari review aplikasi dalam google playstore. Metode

yang digunakan dalam penelitian ini adalah Naive Bayes Classifier (NB), dengan

optimasi penggunaan Feature Selection (FS) Particle Swarm Optimization. Hasil

dari cross validation NB tanpa FS adalah 82.30 % untuk accuracy dan 0.780 untuk

AUC. Sedangkan untuk NB dengan FS adalah 83.60 % untuk accuracy dan 0.801

untuk AUC. Peningkatan sangat signifikan dengan penggunaan Feature Selection

(FS) Particle Swarm Optimization [20].

2.2.7. Penelitian Lutfi Budi Ilmawan dan Edi Winarko (2015)

Penelitian ini bertujuan untuk membangun sistem yang dapat

mengklasifikasikan ulasan pengguna google play yang diberikan melalui aplikasi

mobile dengan menggunakan algoritma klasifikasi data mining berupa Naive

Bayes Classifier dan Support Vector Machine. Hasil dari klasifikasi menggunakan

algoritma Naive Bayes menunjukkan nilai akurasi sebesar 83.87% sedangkan nilai

akurasi yang ditunjukkan oleh algoritma Support Vector Machine sebesar

89.49%[11].

23


2.2.8. Penelitian Vibhor Singh, Priyansh Saxena, Siddharth Singh and S.

Rajendran (2017)

Penelitian ini bertujuan untuk mengklasifikasikan ulasan tentang film

menjadi dua kelas yaitu positif dan negatif untuk mengukur keberhasilan atau

kegagalan film tersebut dan juga untuk memberikan informasi kepada calon

penonton yang pemilih apakah film tersebut boleh ditonton atau tidak. Ada

berbagai pekerjaan yang dilakukan pada pengambilan pendapat dan pengambilan

teks. Penelitian ini berfokus pada menganalisis sentimen dari orientasi semantik

kata-kata yang terjadi dalam teks dengan mendefinisikan kamus secara manual

untuk kata-kata positif, negatif dan intensif yang disimpan dalam file teks yang

berbeda. Dalam penelitian ini peneliti mengekstrak data dari tiga sumber berbeda.

Pendapat yang harus dianalisis adalah preprocessed dan disimpan dalam file teks.

Data kemudian dibandingkan dengan bag of words peneliti untuk menemukan

jumlah sentimen positif dan negatif dalam ulasan film tersebut. Untuk

memprediksi peringkat film.

Algoritma yang digunakan dalam penelitian ini adalah Naive Bayes, K-NN,

dan Decision Tree. Hasil dari pengolahan data yang telah dilakukan menunjukkan

nilai akurasi dari algoritma Naive Bayes sebesar 54.10%, K-NN sebesar 50.28%,

dan Decision Tree sebesar 40.26% [26].

2.2.9. Penelitian Sucitra Sahara dan Rizqi Agung Permana (2019)

Penelitian yang dilakukan adalah menganalisa sentimen terhadap aplikasi

games yang ditujukan untuk anak-anak dengan menggunakan metode K-Nearest

Neighbour. Tujuan dari penelitian ini adalah untuk mengklasifikasikan sentimen

atau ulasan pengguna ke dalam kelas positif atau negatif untuk mengetahui

kualitas games tersebut apakah sesuai atau tidak untuk dikonsumsi anak-anak.

Hasil pengklasifikasian menggunakan metode K-NN menunjukkan nilai akurasi

sebesar 78.50% [22].

2.2.10. Penelitian Lopamudra Dey, Sanjay Chakraborty, Anuraag Biswas, Beepa

Bose, dan Sweta Tiwari (2016)

Memahami sentimen masyarakat terhadap berbagai entitas dan produk

memungkinkan layanan yang lebih baik untuk iklan kontekstual, sistem

rekomendasi, dan analisis tren pasar. Fokus penelitian ini adalah kerangka kerja

24


web crawling yang berfokus pada sentimen untuk memfasilitasi penemuan cepat

pada konten sentimental ulasan film dan ulasan hotel menggunakam analisis yang

sama. Penelitian ini menggunakan metode statistik untuk menangkap elemen gaya

subyektif dan polaritas kalimat. Sentimen yang diperoleh dari hasil crawling

tersebut kemudian akan diklasifikasikan menjadi sentimen positif atau negatif

dengan menggunakan metode data mining yaitu metode Naive Bayes Classifier

dan K-NN dan membandingkan keseluruhan akurasi, precision serta nilai recall.

Dari jumlah keseluruhan data masing-masing review sebesar 5000 data, diperoleh

hasil dari pengolahan data yang paling baik yaitu ketika melakukan fold ke 10

dengan jumlah data 4500 data training, hasil tersebut menunjukkan nilai akurasi

dari review film menggunakan algoritma Naive Bayes sebesar 82.43% dan K-NN

sebesar 69.81%. Sedangkan untuk hasil pengolahan data terhadap review hotel

dengan jumlah fold dan data yang sama menggunakan metode Naive Bayes

menghasilkan nilai akurasi sebesar 55.09% dan K-NN sebesar 52.14% [12].

2.3. Tinjauan Objek penelitian

Objek penelitian ini adalah beberapa aplikasi pembelajaran daring yang

populer di Indonesia dan terdapat pada situs google playstore seperti ruangguru

dan zenius. Dataset yang digunakan dalam penelitian ini adalah data ulasan atau

review pengguna aplikasi pembelajaran daring seperti ruang guru dan zenius yang

diambil dari google playstore. Dataset berupa teks berbahasa Indonesia yang

diperoleh dengan cara melakukan crawling terhadap situs google playstore yang

menampilkan review pelanggan. Dataset hasil crawling ini berupa dokumen teks

yang tidak menyertakan atribut lainnya. Data hasil crawling kemudian dibagi

menjadi dua bagian yaitu data training dan data testing.

25

25


BAB III

METODE PENELITIAN

Gambar 3.1. Model Penelitian Usulan

26


Gambar 3.1 menunjukan model yang diusulkan dalam penelitian dengan

menggunakan metode yang diusulkan yaitu metode CRISP-DM. Penelitian ini

bertujuan untuk mengetahui hasil komparasi dan evaluasi algoritma klasifikasi

data mining pada review aplikasi embelajaran daring yang populer di Indonesia

seperti Ruangguru dan Zenius kedalam kategori positif dan negatif menggunakan

algoritma Naive Bayes Classifier, K-NN, dan Decision Tree. Dalam mendesain

metode penelitian eksperimen ini peneliti menggunakan metode penelitian standar

yang digunakan pada data mining yaitu CRISP-DM.

3.1. Bussines Understanding

Pemahaman terhadap bisnis atau apa yang akan di bahas pada tulisan ini

sebagai memahami objek penelitian, objek penelian yang akan diteliti pada

penelitian ini adalah dua aplikasi pembelajaran daring yang paling populer di

Indonesia yaitu Ruang guru dan Zenius. Adapun tahap ini bertujuan untuk

memahami bidang masalah, menghasilkan solusi yang tepat, dan mengungkapkan

faktor penting yang berpengaruh pada hasil penelitian. Pada penelitian yang akan

dilakukan ini terdapat kebutuhan pengkategorian dari review terhadap aplikasi

tersebut yang diperoleh dari penilaian pengguna aplikasi yang diambil dari google

playstore verifikasi terhadap penilaian tersebut penting dilakukan dan karena

jumlah penilaian pengguna yang sangat banyak sehingga dibutuhkan data mining

untuk melakukan pengkategorian.

3.2. Data Understanding

Pada tahap ini peneliti mengumpulkan, mengidentifikasi, dan memahami

data yang dimiliki. Data tersebut juga harus dapat diverifikasi kebenarannya. Data

yang akan digunakan dalam penelitian ini adalah data review pelanggan aplikasi

pembelajaran daring yang populer di Indonesia yaitu Ruangguru dan Zenius yang

diambil dari google playstore.

3.3. Data Preparation

Pada tahap ini data awal yang diperoleh dari pengumpulan data melalui

proses crawling pada google playstore dari masing-masing aplikasi pembelajaran

daring yang diambil. Review pengguna masing-masing aplikasi yang diambil

sebagai sampel adalah review atau komentar yang diberikan oleh pengguna

aplikasi dari tanggal 1 Januari 2020 sampai dengan 26 April 2020. Dari semua

27


data yang sudah terkumpul, tidak semua data dapat digunakan. Oleh karena itu

perlu dilakukan tahap preprocessing terhadap data tersebut, proses preprocessing

yang digunakan diantaranya adalah dengan melakukan case folding, normalize,

anotation removal, stemming, dan tokenizing, lalu melihat hasilnya.

3.4. Modelling

Dalam tahap Modelling ini akan dilakukan teknik pengklasifikasian data

yang paling akurat. Untuk membandingkan atau mengkomparasi, pada penelitian

ini akan digunakan algoritma Naive Bayes Classifier, K-NN, dan Decision Tree

dengan menggunakan tools Knime.

3.5. Evaluation

Model yang terbentuk dari proses modelling akan diuji menggunakan

confusion matrix sehingga dapat diketahui tingkat akurasi. Confusion Matrix akan

menggambarkan hasil akurasi mulai dari prediksi positif yang benar, prediksi

positif yang salah, prediksi negatif yang benar dan prediksi negatif yang salah.

Akurasi akan dihitung dari seluruh hasil prediksi yang benar (baik prediksi positif

dan negatif) dibandingkan dengan seluruh data testing. Semakin tinggi nilai

akurasi, semakin baik pula model yang dihasilkan. Pengujian juga diukur dengan

menggunakan ROC Curve. ROC Curve akan menggambarkan kelas positif dalam

bentuk kurva. Pengujian dilakukan dengan menghitung nilai Area Under Curve

(AUC), semakin tinggi nilai AUC dan ROC Curve, maka semakin baik pula

model klasifikasi yang terbentuk.

3.6. Deployment

Tahap ini adalah tahap terakhir dari CRISP-DM, yaitu hasil dari seluruh

tahapan yang sebelumnya digunakan secara nyata. Maknanya adalah melakukan

sesuatu berdasarkan pengetahuan yang didapatkan dari kegiatan mining terhadap

data. Penerapan dalam penelitian ini akan dikembangkan dengan NodeJs dan

ReactJs dengan konsep dasar web service.

Adapun rincian waktu kegiatan penelitian (Timeline) yang dilakukan dibuat

dalam bentuk tabel seperti yang ditampilkan pada tabel 3.1 di bawah ini:

28


Tabel 3.1. Jadwal kegiatan (Timeline)

No. Keterangan September Oktober November Desember

1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4

1 Analisis

Kebutuhan

2 Penentuan

Judul

3 Studi

Literatur

4 Penentuan

Metode

Penelitian

5 Analisis

Data

6 Pengolahan

Data

7 Deployment

8 Dokumentasi

29

29


BAB IV

HASIL PENELITIAN DAN PEMBAHASAN

Berdasarkan metodologi penelitian yang telah dipaparkan sebelumnya, pada

bab ini akan dijelaskan implementasi dari metodologi penelitian yang dilakukan

sebagai berikut:

4.1. Business Understanding

Pada tahapan business understanding, dilakukan pemahaman terhadap objek

penelitian. Pemahaman mengenai objek penelitian dilakukan dengan menggali

informasi melalui hasil review pengguna aplikasi pembelajaran daring yang

diberikan melalui google playstore. Pada tahap ini data review pengguna yang

masuk akan dikelompokkan berdasarkan isi dari masing-masing kategori.

Pada tahap ini juga dilakukan pemahaman untuk mencari metode dengan

pendekatan model pengkategorian terbaik agar dapat membantu pada saat proses

pengolahan data yang akan dilakukan dengan cara membandingkan hasil dari

pengolahan data dengan algoritma data mining. Adapun algoritma data mining

yang digunakan adalah algoritma Naive Bayes, Decision Tree, dan KNN untuk

mengetahui akurasi dari metode pengkategorian yang digunakan.

4.2. Data Understanding

Proses yang dilakukan dalam tahap ini adalah memahami data yang akan

digunakan sebagai objek penelitian untuk dapat dilanjtkan ke tahap preprocessing.

Pada tahap ini dilakukan proses pengambilan data mentah sesuai dengan atribut

yang dibutuhkan dari review pelanggan aplikasi pembelajaran daring ruangguru

dan zenius dari tanggal 1 Januari smpai dengan 26 April 2020 dengan

memperhatikan rating atau bintang.

Berikut adalah beberapa contoh review positif dan negatif yang diberikan

oleh pengguna terhadap aplikasi ruangguru dan zenius:

30


Sumber: Google playstore

Gambar 4.1. Contoh review positif dari pengguna ruangguru

Gambar 4.1 merupakan beberapa contoh review positif dengan rating

bintang 5 yang diberikan oleh pengguna aplikasi ruangguru. Biasanya review ini

berisi komentar positif yang diberikan oleh pengguna untuk aplikasi ruangguru

atau berupa emoticon yang mengekspresikan perasaan pengguna terhadap layanan

aplikasi ruangguru.

31



Gambar 4.2. Contoh review negatif dari pengguna ruangguru

Gambar 4.2 menunjukkan beberapa review negatif yang diberikan pengguna

terhadap aplikasi ruangguru. Review negatif yang diberikan ditandai dengan

rating bintang satu dan pada umumnya review negatif ini berisi komentar negatif

atau emoticon yang mengekspresikan perasaan atau keluhan dari pengguna

aplikasi ruangguru.

32



Gambar 4.3. Contoh review positif dari pengguna zenius

Gambar 4.3 menunjukkan beberapa review positif dari paa pengguna

aplikasi pembelajaran daring zenius. Review positif tersebut ditandai dengan

rating lima bintang dan biasanya berisi komentar positif ataupun emoticon yang

menunjukkan kepuasan pengguna terhadap layanan aplikasi zenius.

33



Gambar 4.4. Contoh review negatif dari pengguna zenius

Gambar 4.4 menunjukkan beberapa review negatif yang diberikan oleh para

pengguna aplikasi pembelajaran daring zenius. Review negtif ditandai dengan

rating bintang satu dan review negatif biasanya berisi komentar-komentar negatif

ataupun emoticon yang mengekspresikan perasaan pengguna atau keluhan

pengguna terhadap layanan yang diberikan oleh aplikasi zenius.

Data yang diperoleh dari proses crawling dari google playstore pada

aplikasi ruangguru sebelumnya berjumlah 3.997 data. Sedangkan untuk hasil

crawling pada aplikasi zenius data awal berjumlah 2.027.

4.3. Data Preparation

Tahap ini merupakan tahap proses penyiapan data yang bertujuan untuk

mendapatkan data yang bersih dan siap untuk digunakan dalam penelitian. Dari

data awal yang diperoleh kemudian dilakukan proses cleansing untuk

menghilangkan duplicate kata dan menghilangkan data yang tidak relevan dan

tidak berhubungan dengan masing-masing aplikasi tersebut. Setelah proses

34


cleansing dilakukan, diperoleh data sebanyak 1.785 data review aplikasi

ruangguru dan 1.003 data review aplikasi zenius. Dari data yang diperoleh

kemudian dibuat menjadi dataset dengan atribut dataset berupa text dan label. Text

berisi komentar-komentar pengguna aplikasi yang diberikan melalui google play

store dan label berisi kategori dari komentar tersebut berupa positif dan negatif.

Data review dari masing-masing aplikasi kemudian dikelompokkan menjadi satu

dan disimpan dalam microsoft excel dengan format .xlxs sehingga membentuk

dua dataset yaitu dataset ruangguru dan zenius.

Proses pelabelan dan pengkategorian dilakukan oleh tim verifikator, hal ini

sangat efisien karena dapat menekan biaya dibandingkan dengan menggunakan

jasa para ahli/pakar bahasa Indonesia untuk melakukan hal tersebut. Hasil dari

labelling dan pengkategorian yang dilakukan oleh tim verifikator bertujuan agar

status data menjadi normal dalam penelitian text mining. Adapun hasil dari tahap

ini adalah sebagai berikut:

Tabel 4.1. Hasil pelabelan terhadap dataset review aplikasi ruangguru

Label Jumlah

Positif 892

Negatif 893 Sumber: hasil penelitian

Tabel 4.1 menunjukkan jumlah data dari masing-masing kategori pada

data review pengguna aplikasi ruangguru yang akan digunakan dalam penelitian

ini.

Tabel 4.2. Hasil pelabelan terhadap dataset review aplikasi zenius

Label Jumlah

Positif 567

Negatif 436 Sumber: hasil penelitian

Tabel 4.2 menunjukkan jumlah data dari masing-masing kategori pada

data review pengguna aplikasi zenius yang akan digunakan dalam penelitian ini.

Tahapan awal yang akan dilakukan dalam penelitian ini adalah tahap text

preprocessing, peneliti menggunakan tools gataframework.com dan Knime untuk

melakukan tahap text preprocessing. Berikut merupakan tahapan yang dilakukan

dalam text preprocessing:

35


Sumber: hasil penelitian

Gambar 4.5. Proses preprocessing dengan gataframework

Gambar 4.5 adalah proses preprocessing document menggunakan tools

gataframework.com. Dari hasil preprocessing menggunakan gataframework, data

belum sepenuhnya bersih sehingga dalam proses pengolahannya menggunakan

aplikasi Knime masih perlu ditambahkan beberapa proses preprocessing lagi.

Sumber: Hasil penelitian

Gambar 4.6. Proses preprocessing dengan Knime

36


Gambar 4.6 adalah tahap preprocessing yang dilakukan dalam penelitian

ini, permodelan dibuat menggunakan tools Knime versi 4.1.3

4.3.1. Case Folding

Proses case folding bertujuan untuk mengkonversi komentar-komentar yang

diberikan oleh pengguna menjadi huruf kecil keseluruhan. Berikut adalah

perbandingan text sebelum dan sesudah melalui proses case folding:

Tabel 4.3. Perbandingan komentar sebelum dan sesudah dilakukan case folding

Data Sebelum Data Sesudah

Ruang Guru bagus banget buat belajar

apalagi saat dirumah

"ruang guru bagus banget buat belajar

apalagi saat dirumah"

Saya suka belajar dengan ZENIUS.

Penjelasan mudah dimengerti. karena

setiap materi diajarkan mulai dari

dasarnya sampai komplek. pembahasan

soal soal mudah dipahami. zennnnius

rekomended bangat buat dipakai belajar

setiap harinya. thanks zeniussssssss.

"saya suka belajar dengan zenius.

penjelasan mudah dimengerti. karena


dasarnya sampai komplek. pembahasan

soal soal mudah dipahami. zennnnius


setiap harinya. thanks zeniussssssss." Sumber: Hasil penelitian

Tabel 4.3 menunjukkan hasil dari proses case converter yang dilakukan

pada tahap preprocessing. Pada tahap ini dapat dilihat bahwa semua huruf yang

ada diseragamkan menjadi huruf kecil semua.

4.3.2. Penggunaan @Annotation removal, Regex Filter dan emoticon

normalization

Tahap ini bertujuan untuk menghilangkan item yang tidak diperlukan seperti

@, #, emoticon dan juga penulisan huruf yang berlebihan sehingga merusak

makna kata. Berikut adalah perbandingan hasil text komentar asli dan yang telah

melalui tahap regex filter:

Tabel 4.4. Perbandingan komentar sebelum dan sesudah dilakukan regex filter


salam 5,6 triliun. hahaha salam triliun hahaha

pembahasannya berbayar?? kirain

gratis. Uninstall

pembahasannya berbayar kirain gratis

uninstall

matematika soshumnya kok ga ada kak

di apk?

matematika soshumnya kok ga ada kak

di apk

thank you, zenius meski update, zenius thank you zenius meski update zenius

37



jgn prnah hapus yg ada ya. sukses

bareng zenius!

jgn prnah hapus yg ada ya sukses

bareng zenius Sumber: Hasil penelitian

Tabel 4.4 menunjukkan hasil perbandingan dari komentar yang diberikan

pengguna terhadap aplikasi yang menjadi objek penelitian.

4.3.3. Penggunaan N Chars Filter

Tahap ini bertujuan untuk memilah dokumen dengan menghilangkan

komentar pengguna yang jumlah karakternya kurang dari N. Nilai N yang

ditentukan dalam penelitian ini adalah 3 jadi jika ada komentar pengguna yang

jumlah karakternya kurang dari 3 otomatis akan dihilangkan.

4.3.4. Stemming

Stemming merupakan proses pembentukan kata menjadi kata dasar, dlam

penelitian ini proses stemming yang dilakukan menggunakan Indonesian

stemming dan bertujuan untuk membentuk kata dasar dari opini yang diberikan

oleh para pengguna aplikasi ruangguru dan zenius.

Tabel 4.5. Hasil stemming

Data sebelum Data sesudah

salah soal no seharusnya saya dapat

seratus

salah soal no harus saya dapat ratus

layanan tanya jawab via surel ditangani

bot cs saya sempat dihubungi orang yg

ngaku rg di wa tanya data niatnya mau

lapor untuk konfirmasi rupamya dikasih

bot maaf saja terima kasih telah

menjawab silakan telusuri laporan user

lain siapa tahu sempat mengalami

semoga tidak ada yg jadi korb full

review

layan tanya jawab via surel ditangani

bot cs saya sempat hubung orang yg

ngaku rg di wa tanya data niat mau

lapor untuk konfirmasi rupamya kasih

bot maaf saja terima kasih telah jawab

sila telusur lapor user lain siapa tahu

sempat alami moga tidak ada yg jadi

korb full review

ikut dalam progran kartu pra kerja

tanpa melalui tender yang jelas

ikut dalam progran kartu pra kerja

tanpa lalu tender yang jelas

saya suka belajar dengan zenius

penjelasan mudah dimengerti karena


dasarnya sampai komplek pembahasan

soal soal mudah dipahami zennnnius


saya suka ajar dengan zenius jelas

mudah erti karena tiap materi ajar mulai

dari dasar sampai komplek bahas soal

soal mudah paham zennnnius

rekomended bangat buat pakai ajar tiap

hari thanks zeniussssssss

38


Data sebelum Data sesudah

setiap harinya thanks zeniussssssss

platform belajar terbaik yang bisa

membuktikan dengan kualitas konten

bukan seperti platform sebelah yang

hanya bisa menyewa banyak artis dan

stasiun tv tapi kontennya biasa saja

platform ajar baik yang bisa bukti

dengan kualitas konten bukan seperti

platform belah yang hanya bisa sewa

banyak artis dan stasiun tv tapi konten

biasa saja Sumber: hasil penelitian

Tabel 4.5 menunjukkan perbedaan data sebelum dan sesudah dilakukan

proses stemming menggunakan Indonesian stemming. Setelah dilakukan proses

stemming, teks review aplikasi yang diberikan oleh para pengguna berubah

menjadi kumpulan kata dasar berbahasa Indonesia. Proses stemming idilakukan

menggunakan tools gataframework.

4.3.5. Penggunaan Stopword

Tahap ini memfilter data komentar dengan merujuk pada stopword

berbahasa indonesia.Proses filter stopword pada penelitian ini menggunakan

stopword tala yang diperoleh dari search engine google. Berikut adalah hasil dari

proses stopword filter yang dilakukan:

Tabel 4.6. Perbandingan komentar sebelum dan sesudah dilakukan stopword filter


mohon keluar dari proyek apbn

walaupun kalian memiliki kapabilitas

bukan masalah peraturannya tapi sense

of crisis nya

mohon proyek apbn milik kapabilitas

bukan_masalah atur sense of crisis

layanan tanya jawab via surel ditangani

bot cs saya sempat dihubungi orang yg

ngaku rg di wa tanya data niatnya mau

lapor untuk konfirmasi rupamya dikasih

bot maaf saja terima kasih telah

menjawab silakan telusuri laporan user

lain siapa tahu sempat mengalami

semoga tidak ada yg jadi korban

layan via surel ditangani bot hubung

orang ngaku data niat lapor konfirmasi

rupamya kasih bot maaf terima kasih

sila telusur lapor user alami moga

tidak_ada korban

kan banyak yang gratis tinggal akses

youtube begitu apalagi ini

memanfaatkan kesempatan dalam

kesempitan buset uninstall jaman

corona begini tolong dong dipakai hati

nurani nya jangan seperti babelo yang

gratis tinggal akses youtube manfaat

sempit buset uninstall jam corona

tolong pakai hati nurani duit melulu

otak muak

39



duit duit duit melulu di otaknya jadi

muak saya nya

waaah jadi keren bangett abis diupdate

kak kalo boleh tolong tambahin soal

stan sama soal utbk biologi kakkkkk

hehehehehe makasih kakk

keren bangett abis diupdate kalo tolong

tambahin stan utbk biologi makasih

aplikasi sangat membantu untuk belajar

dirumah saat kondisi seperti ini

aplikasi bantu ajar rumah kondisi

terimakasih telah memberikan akses

pendidikan yang sama kepada seluruh

anak anak indonesia

terimakasih berik akses didik anak anak

indonesia

belajar harusnya gratis karena berbagi

ilmu ga bikin miskin ilmu semoga

kedepannya pemerintah bekerja sama

dengan perusahaan unicorn untuk

mengembangkan proses belajar yg

efisien dan gratis melalui aplikai yg

lebih mendukung kemajuan bangsa

ajar gratis ilmu bikin miskin ilmu moga

perintah usaha unicorn kembang proses

ajar efisien gratis aplikai dukung maju

bangsa

bagus banget kan ada virus corona aku

belajar nya disini terus juga guru nya

ramah mengajari kita sampai betul bisa

hayo buruan download aplikasi ruang

guru

bagus banget virus corona ajar guru

ramah ajar hayo buru download aplikasi

ruang guru

semua aplikasi mudah di gunakan dan

gampang di pahami

aplikasi mudah gampang paham


Tabel 4.6 menunjukkan hasil pengolahan data sebelum dan sesudah

dilakukan stopword filter terhadap data komentar yang diberikan oleh pengguna

terhadap aplikasi yang menjadi objek penelitian.

4.3.6. Bag Of Words

Tahap ini bertujuan untuk menemukan dan membentuk term dari data

komentar yang diberikan oleh pengguna aplikasi. Berikut adalah beberapa term

yang berhasil dibentuk:

Tabel 4.7. Term yang dibentuk dari proses pembentukan BoW

Teks Term

jangan jd maling uang rakyat jangan[]

maling[]

uang[]

rakyat[]

mohon proyek apbn milik kapabilitas

bukan_masalah atur sense of crisis

mohon[]

proyek[]

40


Teks Term

apbn[]

milik[]

kapabilitas[]

bukan_masalah[]

atur[]

sense[]

crisis[]

gratis tinggal akses youtube manfaat

sempit buset uninstall jam corona

tolong pakai hati nurani babelo duit duit

duit melulu otak muak

gratis[]

tinggal[]

akses[]

youtube[]

manfaat[]

sempit[]

buset[]

uninstall[]

jam[]

corona[]

tolong[]

pakai[]

hati[]

nurani[]

duit[]

melulu[]

otak[]

muak[]

aplikasi bagus coba nyata jurus anak

smk tidak_ada bantu siswa siswi sulit

ajar jurus smk

aplikasi[]

bagus[]

coba[]

nyata[]

jurus[]

anak[]

smk[]

tidak_ada[]

bantu[]

siswa[]

siswi[]

sulit[]

ajar[] Sumber: Hasil penelitian

Tabel 4.7 menunjukkan hasil term yang terbentuk dari beberapa data komentar

yang diberikan oleh pengguna aplikasi yang menjadi objek penelitian.

41


4.3.7. TF-IDF

Pada proses ini dilakukan pembobotan terhadap term yang sudah dibentuk.

Berikut adalah nilai bobot dari beberapa term dari salah satu objek penelitian:

Tabel 4.8. Pembobotan TF-IDF

Term TF IDF

jangan[]

maling[]

uang[]

rakyat[]

0.25

0.25

0.25

2.244

2.941

1.885

2.64

mohon[]

proyek[]

apbn[]

milik[]

kapabilitas[]

bukan_masalah[]

atur[]

sense[]

crisis[]

0.111

0.111

0.111

0.111

0.111

0.111

0.111

0.111

0.111

1.649

2.941

3.241

2.941

3.241

3.241

3.241

3.241

3.241

gratis[]

tinggal[]

akses[]

youtube[]

manfaat[]

sempit[]

buset[]

uninstall[]

jam[]

corona[]

tolong[]

pakai[]

hati[]

nurani[]

duit[]

melulu[]

otak[]

muak[]

0.048

0.048

0.048

0.048

0.048

0.048

0.048

0.048

0.048

0.048

0.048

0.048

0.048

0.048

0.143

0.048

0.048

0.048

1.514

2.398

1.904

2.165

1.924

3.241

2.941

2.202

2.041

2.165

1.407

1.671

2.64

3.241

2.289

2.464

2.543

3.241

aplikasi[]

bagus[]

coba[]

nyata[]

jurus[]

anak[]

smk[]

tidak_ada[]

bantu[]

siswa[]

0.067

0.067

0.067

0.067

0.133

0.067

0.133

0.067

0.067

0.067

0.976

0.904

1.718

1.99

2.015

1.363

1.682

1.694

1.093

2.041

42


Term TF IDF

siswi[]

sulit[]

ajar[]

0.067

0.067

0.067

2.941

2.13

0.808 Sumber: Hasil penelitian

Tabel 4.8 menunjukkan hasil pembobotan TF-IDF terhadap term yang

dibentuk oleh data komentar dari aplikasi yang menjadi objek penelitian.

4.4. Modelling

Merupakan fase pemilihan teknik mining dengan menentukan algoritma

yang akan digunakan. Tools yang digunakan adalah Knime versi 4.1.3. Hasil

pengujian model yang dilakukan dengan mengklasifikasikan data review

pengguna aplikasi pembelajaran daring yang diperoleh dari google playstore

menggunakan algoritma Decision tree, Naive Bayes dan KNN. Aplikasi

pembelajaran daring yang menjadi objek penelitian ini adalah aplikasi ruangguru

dan aplikasi zenius.

4.4.1. Proses modelling data review dari pengguna aplikasi pembelajaran

ruangguru.


Gambar 4.7. Model penelitian pengolahan data review dari pengguna aplikasi

ruangguru

43


Gambar 4.7 merupakan model yang dibuat untuk pengolahan data review

yang diberikan oleh pengguna aplikasi ruangguru menggunakan algoritma

decision tree, naive bayes dan KNN.

Desain model penelitian ini menggunakan excel reader, column filter, string

to document, pre-processing, document vector, category to class, color

handle,cross validation, partitioning, decision tree learner, naive bayes learner,

decision tree predictor, naive bayes predictor, K-Nearest Neighbor, scoring dan

ROC curve. Permodelan ini menggunakan excel reader sebagai media untuk

membaca file dataset. Column filter digunakan untuk filterisasi kolom dari atribut

dataset yang akan diolah. String to document digunakan untuk mengubah tipe

data pada kolom yang telah di filter menjadi dokumen. Pre-processing digunakan

untuk membersihkan dan menyelaraskan data. Category to class untuk

menentukan kelas yang digunakan sebagai label atau kategori adalah postif dan

negatif, kelas ini nantinya akan menunjukkan hasil klasifikasi dari tiap-tiap

algoritma yang digunakan dalam penelitian ini. Metode evaluation yang

digunakan adalah partitioning dan cross validation dimana metode partitioning

ini membagi dataset secara otomatis menjadi data training dan data testing

sedangkan metode cross validation melakukan evaluasi terhadap dataset dengan

sistem mengulang pengujian data sesuai dengan jumlah fold yang ditentukan.

Pada penelitian ini jumlah fold ditentukan sebanyak 10, dengan demikian berarti

model evaluasi dengan cross validation akan melakukan pengujian data dengan

melakukan pengulangan evaluasi sebanyak 10 kali. Decision tree learner dan

naive bayes learner berfungsi sebagai penghubung untuk menggunakan algoritma

predictor yaitu decision tree predictor dan naive bayes predictor sebagai penentu

klasifikasi. K-Nearest Neighbour merupakan salah satu algoritma yang

digunakakan untuk mengklasifikasikan data. Scoring digunakan untuk

menunjukkan hasil akurasi yang diperoleh. Sedangkan ROC curve adalah media

untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.

44


4.4.2. Proses modelling data review dari pengguna aplikasi pembelajaran zenius


Gambar 4.8. Model penelitian pengolahan data review dari pengguna aplikasi

zenius

Gambar 4.8 menunjukkan desain model penelitian menggunakan tools

Knime untuk pengolahan dataset komentar pengguna aplikasi zenius. Alur dan

komponen yang digunakan dalam mengolah dataset komentar pengguna aplikasi

zenius sama dengan pengolahan dataset komentar pengguna aplikasi ruangguru.

4.5. Evaluation

Tahapan evaluasi bertujuan untuk menentukan nilai kegunaan dari model

yang telah berhasil dibuat pada langkah sebelumnya. Untuk evaluasi digunakan

partitioning. Berikut ini adalah hasil dari proses pengujian masing-masing dataset

aplikasi pembelajaran daring dengan metode decision tree, naive bayes, dan KNN.

4.5.1. Evaluation permodelan untuk dataset komentar pengguna aplikasi

ruangguru

Dataset hasil review aplikasi ruangguru setelah melalui tahap

preprocessing berjumlah 1.785 data. Data tersebut kemudian diolah dengan

45


desain permodelan menggunakan tools Knime, hasil yang diperoleh dari

permodelan tersebut sebagai berikut:

1. Hasil evaluasi dengan metode decision tree

Hasil evaluasi menggunakan algoritma decision tree dengan model evaluasi

cross validation menunjukkan nilai akurasi sebesar 81,7%. Hasil akurasi yang

diperoleh ditunjukkan dengan confussion matrix yang terbentuk sebagai berikut:

Tabel 4.9. Confussion matrix dataset ruangguru dengan metode decision tree dan

validasi cross validation

Document Negatif Positif Precision

Negatif 613 217 0,868

Positif 102 750 0,776

Recall 0,756 0,88


Tabel 4.9 merupakan tabel yang menunjukkan confussion matrix yang

terbentuk dari proses pengolahan dataset ruangguru dengan metode evaluasi cross

validation. Confusion matrix memberikan penilaian performance klasifikasi

berdasarkan objek benar dan salah. confusion matrix berisi informasi aktual dan

prediksi pada sistem klasifikasi.

Evaluasi dataset ruangguru dengan algoritma decision tree juga dilakukan

dengan model validasi partitioning dengan komposisi 70% data training dan 30%

data testing. Hasil evaluasi menunjukkan nilai akurasi sebesar 78,8% dengan

confussion matrix sebagai berikut:

Tabel 4.10. Confussion matrix dataset ruangguru dengan metode decision tree dan

validasi partitioning


Negatif 192 75 0,842

Positif 36 220 0,746

Recall 0,719 0,859


46


Selain confussion matrix tingkat akurasi ini juga didukung oleh kurva ROC,

berikut adalah kurva ROC yang terbentuk dari hasil pengolahan dataset dengan

metode decision tree dengan partitioning:


Gambar 4.9. ROC curve dari algoritma decision tree dengan validasi partitioning

Gambar 4.9 menunjukkan kurva ROC yang terbentuk dari hasil pengolahan

dataset ruangguru menggunakan algoritma decision tree dengan partitioning. Dari

kurva tersebut dapat diketahui nilai AUC yang tertinggi adalah sebesar 0,8740.

47



Gambar 4.10. Decision tree view dataset ruangguru

Gambar 4.10 menunjukkan model tree view dan hasil klasifikasi yang

terbentuk setelah data diolah menggunakan algoritma decision tree dengan

validasi partitioning. Tree view tersebut menunjukkan sentimen negatif dan

sentimen positif.

48


2. Hasil evaluasi dengan metode naive bayes

Hasil evaluasi menggunakan algoritma naive bayes dengan model validasi

cross validation menunjukkan nilai akurasi sebesar 48,9%. Hasil akurasi yang

diperoleh ditunjukkan dengan confussion matrix yang terbentuk sebagai berikut:

Tabel 4.11. Confussion matrix dataset ruangguru dengan metode naive bayes dan


Document Positif Negatif Precision

Positif 852 890 1

Negatif 0 0 0

Recall 0,489 0



terbentuk dari proses pengolahan dataset ruangguru menggunakan metode naive

bayes dan model validasi cross validation.

Evaluasi dataset ruangguru menggunakan algoritma naive bayes juga

dilakukan dengan menggunakan model validasi partitioning. Dari hasil

permodelan evaluasi dengan model validasi partitioning diperoleh nilai akurasi

sebesar 48,9%. Berikut merupakan confussion matrix yang terbentuk dari hasil

permodelan evaluasi dataset ruangguru dengan validasi partitioning:

Tabel 4.12. Confussion matrix dataset ruangguru dengan metode naive bayes dan



Positif 256 0 0,489

Negatif 267 0 0

Recall 1 0


Tabel 4.12 menunjukkan confussion matrix yang terbentuk dari hasil

pengolahan dataset ruangguru dengan algoritma naive bayes dan validasi

partitioning.

49


Selain confussion matrix nilai akurasi yang diperoleh juga ditunjukkan

dengan kurva ROC. Berikut adalah kurva ROC untuk hasil pengolahan dataset

menggunakan metode naive bayes dengan validasi partitioning:


Gambar 4.11. ROC curve hasil pengolahan dataset ruangguru dengan metode

naive bayes dan validasi partitioning

Gambar 4.11 menunjukkan kurva ROC yang terbentuk dari hasil

pengolahan dataset ruangguru menggunakan algoritma naive bayes dengan

validasi partitioning. Dari kurva tersebut dapat diketahui nilai AUC yang tertinggi

adalah sebesar 0,5000.

3. Hasil evaluasi dengan metode KNN

Hasil evaluasi menggunakan algoritma KNN menggunakan validasi cross

validation dengan nilai K=3 menunjukkan nilai akurasi sebesar 81,1%. Hasil

akurasi yang diperoleh ditunjukkan dengan confussion matrix yang terbentuk

sebagai berikut:

50


Tabel 4.13. Confussion matrix dataset ruangguru dengan metode KNN dan



Negatif 798 92 0,771

Positif 237 615 0,87

Recall 0,897 0,722



terbentuk dari proses pengolahan dataset ruangguru menggunakan algoritma KNN

dengan model validasi cross validation.

Selain menggunakan model validasi cross validation, pengolahan dataset

ruangguru dengan algoritma KNN juga dievaluasi menggunakan model vaidasi

partitioning. Hasil evaluasi algoritma KNN menggunakan validasi partitioning

menunjukkan nilai akurasi sebesar 79%. Confussion matrix yang terbentuk dari

hasil evaluasi tersebut sebagai berikut:

Tabel 4.14. Confussion matrix dataset ruangguru dengan metode KNN dan



Negatif 239 28 0,745

Positif 82 174 0,861

Recall 0,895 0,68


Tabel 4.14 menunjukkan nilai confussion matrix serta nilai recall dan

precision yang didapatkan dari pengolahan dataset ruangguru mengunakan

algoritma KNN dengan nilai K=3 dan model validasi partitioning idimana model

validasi ini membagi dataset imenjadi data training dan data testing.

Confusion matrix memberikan penilaian performance klasifikasi

berdasarkan objek benar dan salah. Dari confussion matrix tersebut juga terbentuk

kurva ROC yang mendukung hasil klasifikasi. Kurva ROC yang terbentuk dari

51


hasil pengolahan dataset menggunakan metode KNN dan metode validasi

partitioning sebagai berikut:


Gambar 4.12. ROC curve hasil pengolahan dataset ruangguru dengan metode

KNN dan validasi partitioning

Gambar 4.12 merupakan kurva ROC yang terbentuk dari hasil pengolahan

dataset ruangguru menggunakan metode KNN dan validasi partitioning. Dari

kurva tersebut dapat diketahui nilai AUC yang tertinggi sebesar 0,8754.

4.5.2. Evaluation permodelan untuk dataset komentar pengguna aplikasi zenius

Dataset hasil review aplikasi ruangguru setelah melalui tahap preprocessing

berjumlah 1.003 data. Data tersebut kemudian diolah dengan desain permodelan

menggunakan tools Knime, hasil yang diperoleh dari permodelan tersebut sebagai

berikut:

52


1. Hasil evaluasi dengan metode decision tree

Hasil evaluasi menggunakan algoritma decision tree dengan validasi cross

validation menunjukkan nilai akurasi sebesar 81,2%. Hasil akurasi yang diperoleh

ditunjukkan dengan confussion matrix yang terbentuk sebagai berikut:

Tabel 4.15. Confussion matrix dataset zenius dengan metode decision tree dan



Negatif 300 130 0,877

Positif 42 518 0,799

Recall 0,698 0,925


Tabel 4.15 merupakan confussion matrix yang terbentuk dari pengolahan

dataset komentar pengguna aplikasi zenius menggunakan algoritma atau metode

decision tree dan validasi cross validation.

Dataset yang berisi komentar dari aplikasi pembelajaran daring zenius juga

diolah menggunakan algoritma decision tree dengan validasi partitioning.

Validasi partitioning bekerja dengan cara membagi data menjadi dua bagian yaitu

data training dan data tesing. Dari hasil pengolahan dataset zenius dengan

validasi partitioning diperoleh nilai akurasi sebesar 79,5% dan confussion matrix

yang terbentuk sebagai berikut:

Tabel 4.16. Confussion matrix dataset zenius dengan metode decision tree dan



Negatif 88 41 0,815

Positif 20 148 0,783

Recall 0,682 0,881


Tabel 4.16 menunjukkan confussion matrix yang dibentuk dalam

pengolahan dataset yang berisi komentar pengguna aplikasi zenius menggunakan

algoritma decision tree dan validasi partitioning. Confussion matrix tersebut

menunjukkan hasil klasifikasi benar dan salah.

53


Selain confussion matrix tersebut, dari pengolahan dataset ini juga terbentuk

kurva ROC sebagai berikut:


Gambar 4.13. ROC curve hasil pengolahan dataset zenius dengan algoritma

decision tree dan validasi partitioning

Gambar 4.13 menunjukkan kurva ROC yang terbentuk dari hasil

pengolahan dataset yang berisi review dari para pengguna aplikasi zenius

menggunakan metode decision tree. Dari hasil tersebut dapat diketahui nilai AUC

yang diperoleh sebesar 0,8247

54



Gambar 4.14. Decision tree view dataset zenius

Gambar 4.14 menunjukkan model tree view dan hasil klasifikasi yang

terbentuk setelah data diolah menggunakan algoritma decision tree dengan

partitioning. Tree view tersebut menunjukkan sentimen negatif dan sentimen

positif yang terbentuk dari model.

2. Hasil evaluasi dengan metode naive bayes

Hasil evaluasi terhadap dataset yang berisi komentar pengguna aplikasi

zenius yang diolah menggunaka algoritma naive bayes dan validasi cross

validation menunjukkan nilai akurasi sebesar 59,5%. Confussion matrix yang

55


terbentuk dari hasil klasifikasi menggunakan algoritma naive bayes dan validasi

cross validation sebagai berikut:

Tabel 4.17. Confussion matrix dataset zenius dengan metode naive bayes dan



Negatif 201 23 0,359

Positif 359 407 0,947

Recall 0,897 0,531



pengolahan dataset yang berisi komentar pengguna aplikasi zenius menggunakan

algoritma naive bayes dan validasi cross validation. Confussion matrix tersebut

menunjukkan hasil klasifikasi benar dan salah.

Selain menggunakan validasi cross validation dalam penelitian ini juga

diterapkan pengolahan dataset komentar pengguna aplikasi pembelajaran daring

zenius menggunakan algoritma naive bayes dan validasi partitioning. Cara kerja

metode validasi ini dengan membagi dataset menjadi data training dan data

testing. Dari hasil evaluasi menggunakan validasi partitioning diperoleh nilai

akurasi sebesar 56,6% dengan confussion matrix sebagai berikut:

Tabel 4.18. Confussion matrix dataset zenius dengan metode naive bayes dan



Positif 168 0 0,566

Negatif 129 0 0

Recall 1 0



pengolahan dataset komentar pengguna aplikasi pembelajaran daring zenius

menggunakan algoritma naive bayes dan validasi partitioning. Confussion matrix

menunjukkan hasil klasifikasi data benar dan salah.

Berdasarkan hasil klasifikasi yang telah diperoleh, maka terbentuk kurva

ROC sebagai berikut:

56



Gambar 4.15. ROC curve hasil pengolahan dataset zenius dengan metode naive

bayes dan validasi partitioning

Gambar 4.15 menunjukkan kurva ROC yang terbentuk dari pengolahan

dataset yang berisi komentar pengguna aplikasi zenius. Dari kurva tersebut dapat

diketahui bahwa nilai AUC yang diperoleh adalah sebesar 0,5000.

3. Hasil evaluasi dengan metode KNN

Hasil evaluasi dataset yang berisi komentar dari para pengguna aplikasi

zenius yang diolah menggunakan algoritma KNN dan validasi cross validation

dengan nilai K=3 menunjukkan nilai akurasi sebesar 82,2%. Confussion matrix

yang terbentuk dari hasil pengolahan dataset tersebut adalah:

57


Tabel 4.19. Confussion matrix dataset zenius dengan metode KNN (K=3) dan



Negatif 378 52 0,758

Positif 121 439 0,894

Recall 0,879 0,784



pengolahan dataset yang berisi komentar para pengguna aplikasi zenius

menggunakan algoritma KNN dan validasi cross validation.

Evaluasi dataset zenius dengan algoritma KNN juga dilakukan dengan

menerapkan validasi partitioning untuk menguji data dan mengetahui nilai

akurasinya. Dengan cara kerja validasi partitioning yaitu dengan membagi dataset

menjadi data training dan data testing sesuai dengan presentase yang diinginkan

peneliti maka diperoleh hasil akurasi sebesar 80,5%. Confussion matrix yang

terbentuk dari hasil evaluasi dengan metode KNN dan validasi partitioning

sebagai berikut:

Tabel 4.20. Confussion matrix dataset zenius dengan metode KNN (K=3) dan



Negatif 107 22 0,748

Positif 36 132 0,857

Recall 0,829 0,786



pengolahan dataset komentar pengguna aplikasi pembelajaran daring zenius

menggunakan algoritma KNN dengan nilai K=3 dan validasi partitioning.

Confussion matrix menunjukkan hasil klasifikasi data benar dan salah.

Selain confussion matrix tersebut, hasil klasifikasi juga ditunjukkan dengan

kurva ROC sebagai berikut:

58



Gambar 4.16. ROC curve hasil pengolahan dataset zenius dengan metode KNN

dan validasi partitioning

Gambar 4.16 menunjukkan kurva ROC yang terbentuk dari pengolahan

dataset yang berisi komentar pengguna aplikasi zenius. Dari kurva tersebut dapat

diketahui bahwa nilai AUC yang diperoleh adalah sebesar 0,8822.

Dari hasil pengolahan kedua dataset yang berisi data komentar dari para

pengguna aplikasi pembelajaran daring ruangguru dan zenius, berikut ini penulis

sajikan komparasi nilai akurasi untuk masing-masing dataset yang diolah

menggunakan algoritma decision tree, naive bayes, dan KNN dengan nilai K=3:

Tabel 4.21. Perbandingan nilai akurasi dari masing-masing hasil pengujian

Algoritma Ruangguru Zenius

Accuracy (Cross Validation)

Decision tree 81,7% 81,2%

Naive bayes 48,9% 59,5%

59


Algoritma Ruangguru Zenius

Accuracy (Cross Validation)

KNN (K=3) 81,1% 82,2%

Accuracy (Partitioning)

Decicion tree 78,8% 79,5%

Naive bayes 48,9% 56,6%

KNN (K=3) 79% 80,5%


Tabel 4.21 menunjukkan hasil akurasi dari masing-masing eksperimen

terhadap dataset ruangguru dan zenius. Dari nilai akurasi tersebut dapat diketahui

bahwa nilai akurasi tertinggi pada pengolahan dataset ruangguru diperoleh ketika

diolah dengan menggunakan algoritma decision tree dan validasi cross validation

dengan nilai akurasi sebesar 81,7%. Sedangkan nilai akurasi tertinggi untuk

pengolahan dataset dari review aplikasi zenius diperoleh ketika dataset diolah

menggunakan algoritma KNN dengan nilai K=3 dan validasi cross validation

dengan nilai akurasi sebesar 82,2%.

4.6. Deployment

Berdasarkan hasil evaluasi dari proses pengujian menggunakan beberapa

algoritma klasifikasi data mining, hasil akurasi tertinggi diperoleh ketika data

diolah dengan algoritma KNN dengan model validasi cross validation. Maka dari

itu bobot yang akan digunakan dalam tahap deployment ini yaitu berdasarkan dari

hasil pengujian algoritma KNN. Proses deployment tidak dapat langsung

dilakukan menggunakan korpus data dari algoritma KNN, dikarenakan data dari

algoritma KNN hanya mempunyai nilai pembobotan karakter 0 sampai dengan 1.

Flowchart dari aplikasi sentiment analisis pembelajaran daring yang akan

dibuat sebagai berikut:

60


Gambar 4.17. Flowchart aplikasi Analisa sentimen aplikasi pembelajaran daring

Gambar 4.17 menunjukkan flowchart yang menggambarkan cara kerja atau

jalannya aplikasi Analisa sentiment pembelajaran daring. Cara kerja aplikasi ini

diawali dengan input data oleh user lalu data tersebut otomatis akan

dipreprocessing oleh system dan dilakukan pengkategorian oleh system

menggunakan data kategori dari training data dan algoritma KNN setelah itu akan

dimunculkan hasil dari pengkategoriannya berupa komentar positif atau negative

dan system selesai menjalankan instruksi. Berikut tampilan home dari aplikasi

analisa sentiment pembelajaran daring:

Gambar 4.18. Tampilan halaman home aplikasi pembelajaran daring

61


Gambar 4.18. merupakan halaman home dari aplikasi analisa pembelajaran

daring. Untuk melakukan testing data user tinggal klik menu ruangguru atau

zenius lalu akan diarahkan otomatis ke halaman input data seperti berikut:

Gambar 4.19. Halaman testing data

Gambar 4.19. merupakan halaman testing data, dihalaman ini user dapat

menginput komentar yang akan di testing, kemudian akan muncul hasil seperti

berikut:

Gambar 4.20. Halaman hasil kategori

62


Gambar 4.20 merupakan halaman yang menunjukkan hasil dari kategori

sentiment yang di testing. Hasil yang diperoleh dapat dilihat juga per tahap

preprocessing-nya seperti berikut:

Gambar 4.21. Detail preprocessing

Gambar 4.21. menunjukkan detail dari proses preprocessing data yang dapat

dilihat juga oleh user setelah user melakukan tesing data. Hasil pengkategorian

didasarkan pada bobot tiap kata dimana bobot ini menentukan kata tersebut masuk

kedalam kategori positif atau negatif. Dalam aplikasi ini bobot yang ditampilkan

adalah bobot kesimpulan dari hasil pengkategorian.

61

63


BAB V

PENUTUP

5.1. Kesimpulan

Berdasarkan hasil eksperimen yang dilakukan terhadap dataset aplikasi

pembelajaran daring yang berisi komentar pengguna mengenai aplikasi ruangguru

dan zenius dapat ditarik kesimpulan bahwa algoritma data mining berupa decision

tree, naive bayes, dan KNN dapat digunakan untuk mengklasifikasikan sentimen

pengguna aplikasi pembelajaran daring dengan kelas positif dan negatif. Dari

hasil akurasi dan nilai AUC yang diperoleh dapat diketahui bahwa sentimen yang

dihasilkan dari pengguna aplikasi ruangguru dan zenius adalah negatif. Dari hasil

akurasi yang diperoleh, algoritma yang memiliki nilai akurasi tertinggi dalam

pengklasifikasian sentimen dari aplikasi pembelajaran daring ini adalah algoritma

decision tree dan KNN dengan jenis validasi cross validation.

5.2. Saran

Untuk penelitian selanjutnya diharapkan dapat menggunakan algoritma lain

seperti SVM, random fores dan lain-lain agar dapat diketahui nilai akurasinya

serta dapat dilakukan model pengklasifikasian yang berbeda dari penelitian ini.

Selain itu dapat juga ditambahkan fitur optimasi agar hasil akurasi yang diperoleh

dapat lebih maksimal. Agar penelitian lebih akurat, dapat juga menambahkan

jumlah dataset.

64


DAFTAR PUSTAKA

[1] A. E. Sari, S. Widowati, and K. M. Lhaksmana, “Klasifikasi Ulasan

Pengguna Aplikasi Mandiri Online di Google Play Store dengan

Menggunakan Metode Information Gain dan Naive Bayes Classifier,” vol.

6, no. 2, pp. 9143–9157, 2019.

[2] A. F. Kamal and B. Widjajanto, “Text Mining Untuk Analisa Sentiment

Ekspedisi Jasa Pengiriman Barang Menggunakan Metode Naive Bayes

Pada Aplikasi J&T Express,” Ijccs, no. x, pp. 1–5, 2017.

[3] B. Olabenjo, “Applying Naive Bayes Classification to Google Play Apps

Categorization,” 2016, [Online]. Available:

http://arxiv.org/abs/1608.08574.

[4] D. Rusdiaman and D. Rosiyadi, “ANALISA SENTIMEN TERHADAP

TOKOH PUBLIK MENGGUNAKAN METODE NAÏVE BAYES

CLASSIFIER DAN SUPPORT VECTOR MACHINE,” vol. 4, no. 2, pp.

230–235, 2019.

[5] E. Di Rosa and A. Durante, “App2Check: A machine learning-based

system for sentiment analysis of app reviews in Italian language,” CEUR

Workshop Proc., vol. 1696, pp. 8–13, 2016.

[6] E. Indrayuni and M. Wahyudi, “PENERAPAN CHARACTER N-GRAM

UNTUK SENTIMENT ANALYSIS REVIEW HOTEL

MENGGUNAKAN ALGORITMA NAIVE BAYES,” pp. 83–88, 2015.

[7] J. Suntoro, Data Mining: Algoritma dan Implementasi dengan

Pemrograman PHP. Jakarta: PT Elex Media Komputindo, 2019.

[8] Knime, “KNIME Quickstart Guide,” 2019. [Online]. Available:

https://docs.knime.com/2019-

12/analytics_platform_quickstart_guide/index.html#introduction.

[Accessed: 26-Apr-2020].

[9] Kompasiana.com, “Macam-macam Teori Pembelajaran dalam Dunia

Pendidikan,” 2020. .

[10] Kompasiana.com, “‘Sentiment Analysis’, Menganalisis Opini

65


Menggunakan Program Komputer,” 2018. [Online]. Available:

https://www.kompasiana.com/mdanimlywn/5bd9235fab12ae20454e1fc2/se

ntiment-analysis-menganalisis-opini-menggunakan-program-komputer.

[Accessed: 26-Apr-2020].

[11] L. B. Ilmawan and E. Winarko, “Aplikasi Mobile untuk Analisis Sentimen

pada Google Play,” vol. 9, no. 1, pp. 53–64, 2015.

[12] L. Dey, S. Chakraborty, A. Biswas, B. Bose, and S. Tiwari, “Sentiment

Analysis of Review Datasets Using Naïve Bayes‘ and K-NN Classifier,”

Int. J. Inf. Eng. Electron. Bus., vol. 8, no. 4, pp. 54–62, 2016, doi:

10.5815/ijieeb.2016.04.07.

[13] M. E. Syed, “Attribute weighting in K-nearest neighbor classification,”

University of Tampere, 2015.

[14] M. Irsan, “Rancang Bangun Aplikasi Mobile Notifikasi Berbasis Android

Untuk Mendukung Kinerja Di Instansi Pemerintahan,” J. Penelit. Tek.

Inform., vol. 1, no. 1, pp. 115–120, 2015.

[15] M. R. Firdaus, F. M. Rizki, and F. M. Gaus, “Analisis Sentimen Dan Topic

Modelling Dalam Aplikasi Ruangguru,” vol. 4, pp. 66–76, 2020.

[16] M. Z. Nafan and A. E. Amalia, “Kecenderungan Tanggapan Masyarakat

terhadap Ekonomi Indonesia berbasis Lexicon Based Sentiment Analysis,”

J. Media Inform. Budidarma, vol. 3, no. 4, p. 268, 2019, doi:

10.30865/mib.v3i4.1283.

[17] R. D. Probo, B. Irawan, R. Rumani, M. 3, P. S1, and S. Komputer,

“ANALISIS DAN IMPLEMENTASI PERBANDINGAN ALGORITMA

KNN (K- NEAREST NEIGHBOR) DENGAN SVM (SUPPORT

VECTOR MACHINE) UNTUK PREDIKSI PENAWARAN PRODUK

Comparative Analysis and Implementation of KNN (K-Nearest Neighbor)

with SVM (Support Vector Machine) Algorithm ,” vol. 3, no. 3, pp. 4988–

4995, 2016.

[18] Ruangguru, “About Us,” Ruangguru.com, 2020. [Online]. Available:

https://www.ruangguru.com/about/. [Accessed: 26-Apr-2020].

[19] R. Watrianthos, S. Suryadi, D. Irmayani, M. Nasution, and E. F. S.

Simanjorang, “Sentiment analysis of traveloka app using naïve bayes

66


classifier method,” Int. J. Sci. Technol. Res., vol. 8, no. 7, pp. 786–788,

2019, doi: 10.31227/osf.io/2dbe4.

[20] S. A. Saputra, D. Rosiyadi, W. Gata, and S. M. Husain, “Analisis Sentimen

E-Wallet Pada Google Play Menggunakan Algoritma,” vol. 1, no. 10, pp.

3–8, 2019.

[21] S. Kurniawan, W. Gata, D. A. Puspitawati, I. K. S. Parthama, H. Setiawan,

and S. Hartini, “Text Mining Pre-Processing Using Gata Framework and

RapidMiner for Indonesian Sentiment Analysis,” IOP Conf. Ser. Mater.

Sci. Eng., vol. 835, no. 1, 2020, doi: 10.1088/1757-899X/835/1/012057.

[22] S. Sahara and R. A. Permana, “METHODE K-NN FOR ANALYS

SENTIMENT REVIEW KIDS APPS,” vol. 8, no. 2, pp. 127–137, 2019.

[23] S. Wahyu Handani, D. Intan Surya Saputra, Hasirun, R. Mega Arino, and

G. Fiza Asyrofi Ramadhan, “Sentiment analysis for go-jek on google play

store,” J. Phys. Conf. Ser., vol. 1196, no. 1, 2019, doi: 10.1088/1742-

6596/1196/1/012032.

[24] S. Yadav and S. Yadav, “Text Mining of VOOT Application Reviews on

Google Play Store,” Int. Res. J. Eng. Technol. e-ISSN, pp. 1204–1208,

2018.

[25] Sulhaerati, L. Kurnia, A. Kurniansyah, and A. A. Yuhana, “ANALISIS

TANGGAPAN PASAR TERHADAP PERUSAHAAN RITEL RAKSASA

INDOMART DAN ALFAMART,” 2017.

[26] V. Singh, P. Saxena, S. Singh, and S. Rajendran, “Opinion Mining and

Analysis of Movie Reviews,” Indian J. Sci. Technol., vol. 10, no. 19, pp. 1–

6, 2017, doi: 10.17485/ijst/2017/v10i19/112756.

[27] Webharvy, “WebHarvy,” webharvy, 2020. [Online]. Available:

https://www.webharvy.com/.

[28] X. Li, Z. Zhang, and K. Stefanidis, Sentiment-aware Analysis of Mobile

Apps User Reviews Regarding Particular Updates, no. November. 2018.

[29] Y. P. Tanjung, S. R. Sentinuwo, and A. Jacobus, “Penentuan Daya Listrik

Rumah Tangga Menggunakan Metode Decision Tree,” J. Tek. Inform., vol.

9, no. 1, 2016, doi: 10.35793/jti.9.1.2016.14141.

[30] Zenius.net, “About Zenius,” Zenius.net, 2020.

67

DAFTAR RIWAYAT HIDUP

A. Biodata Mahasiswa

N I M : 14002216

Nama Lengkap : Recha Abriana Anggraini

Tempat dan Tanggal Lahir: Cilacap, 05 Oktober 1996

Jenis Kelamin : Perempuan

Alamat : Tinggarjati RT02/01, Gentasari, Kroya, Cilacap

No Telp : 0895375241852

Email : [email protected]

B. Riwayat Pendidikan Formal dan Non-Formal

1. SDN 5 Gentasari, Tahun 2002-2008

2. SMPN 4 Kroya, Tahun 2008-2011

3. SMK YPE Sampang, Tahun 2011-2014

4. D3 Manajemen Informatika AMIK BSI Purwokerto, Tahun 2014-2017

5. S1 Sistem Informasi Universitas BSI Bandung, Tahun 2017-2018

C. Riwayat Pengalaman Organisasi / Pekerjaan

1. Instruktur UBSI Tasikmalaya 2019-Sekarang


(Recha Abriana Anggraini)

mailto:[email protected]

68

LAMPIRAN

Lampiran 1. Contoh data komentar pengguna aplikasi ruangguru

No Text

1 Ruangguru sangat membantu saya saat sedang belajar, apalagi disaat

sedang ada pandemi covid-19 ini yang menjadikan siswa-i tidak bisa pergi

ke bimbel maupun ke sekolah. Sukses selalu untuk ruangguru! Doakan

saya agar dapat merain ptn yang saya inginkan

2 SERUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUU BANGET

BELAJARNYA

3 Sangat bagus dan membantu dalam pembelajaran. Seru belajarnya karena

seperti game. Tapi juga ada videonya jadinya kayak belajar di sekolah ama

guru.

4 Kan sekarang ada covid 19, apa nggak lebih bagus kalau ruangguru

membantu belajar semua siswa indonesia, dengan menggratiskan semua

layanan selama indonesia masih lockdown

5 Bagus bgt dan sangat membantu proses belajar!!! Sukaa!! Tapi masih ada

beberapa kesalahan, terutama di soal2 bacaan tps sbmptn. Masih suka ada

kesalahan pengetikan dan terkadang soal dan jawaban tidak nyambung.

Mohon diperbaikiii

6 Rugi kalo nggak di instal cepet 2 masalahnya kalau nggak punya pulsa

dapet paket 30GB juga koh tapi kelemahannya aku masih belum tahu cara

dapetin koin yang caranya nggak bayar loh jadi aku kasih bintang 4 aslinya

tapi mbok dapet bonus jadi aku kasih bintang 5 makasih ruang guru

7 Sorry neng... Maap udah shitcommenting... Developernya sabar banget ya

nanggepin comment-comment sampah kayak gini... Salutt

8 Ruangguru telah memudahkan kami dalam memahami materi pelajaran yg

ada. Selain itu, admin2 dan timnya sangat baik dan ramah, mereka selalu

berusaha untuk memberikan pelayanan yg terbaik kepada para

penggunanya. Terima kasih, Ruangguru . Terus semangat berinovasi

untuk memajukan pendidikan di Indonesia

69

Lampiran 2. Contoh data komentar pengguna aplikasi zenius

No Text

1 apps ny zenius dh tmbh keren, apps sudah membantu gw, gw ank smp tp

blajar materi sma di zen, alhasil gw sering msk semifinal bbrp lomba fisika

makasih bgt,yg blm download gk bakal rugi lh soalny keren banget

2 saya suka belajar dengan zenius. penjelasan mudah dimengerti. karena

setiap materi diajarkan mulai dari dasarnya sampai komplek. pembahasan

soal soal mudah dipahami. zennnnius rekomended bangat buat dipakai

belajar setiap harinya. thanks zeniussssssss.

3 aku mau play video materi kok gabisa kenapa yaaa??? padahal sinyal

oke

4 tombol fullscreen perlu ditap beberapa kali baru aktif , ketika jump video

maju/mundur , gambarnya jadi rusak

5 Setelah pemakaian selama 8 bulan, saya rasa cara penyampaian materi

kurang baik untuk dipahami, beberapa kata ada yang terus menerus diulang

- ulang (sebenarnya tidak dperlukan) ditambah tulisan di dalam animasinya

sebagian besar kurang jelas alias sulit untuk dibaca. Mungkin hal ini

terdengar sepele

6 Kenapa saya tidak bisa register ataupun log in ya?,tulisannya selalu log in

failed atau register failed

7 Aplikasi nya memang didengar bagus tetapi saya tidak tahu server nya

down apa internet saya yg error karna saya ngestuck di loading profile.

Pertama² waktu saya mau daftar malah dibilangnya email saya sudah

dipake sama orang lain dan waktu saya coba email yg lain baru bisa

8 Ketika saya mencoba login di aplikasi menggunakan akun gmail saya kok

tidak bisa login ya? Muncul tulisan kata sandi tidak valid, padahal email

dan passwordnya sudah sesuai. Tapi kalau saya login di web malah bisa.

Jadinya saya pakai akun twitter saya untuk login di aplikasi dan akun gmail

di web.

70

Lampiran 3. Contoh preprocessing dataset

N

o

Text Status @Anotation Removal Tokenization:

Regexp

Normalization:

Emoticon

Indonesian

Stemming

Transformation: Not

(Negative)

Indonesian Stop

word removal

1 waaah jadi keren

bangett abis diupdate..

kak kalo boleh tolong

tambahin soal2 stan

2018 2019 sama soal

utbk biologi 2019

kakkkkk hehehehehe

makasih kakk

positi

f

waaah jadi keren

bangett abis diupdate..

kak kalo boleh tolong

tambahin soal2 stan

2018 2019 sama soal

utbk biologi 2019

kakkkkk hehehehehe

makasih kakk

waaah jadi keren

bangett abis

diupdate kak kalo

boleh tolong

tambahin soal stan

sama soal utbk

biologi kakkkkk

hehehehehe makasih

kakk

waaah jadi keren

bangett abis

diupdate kak kalo

boleh tolong

tambahin soal stan

sama soal utbk

biologi kakkkkk

hehehehehe makasih

kakk

waaah jadi keren

bangett abis

diupdate kak kalo

boleh tolong

tambahin soal stan

sama soal utbk

biologi kakkkkk

hehehehehe makasih

kakk

waaah jadi keren

bangett abis

diupdate kak kalo

boleh tolong

tambahin soal stan

sama soal utbk

biologi kakkkkk

hehehehehe makasih

kakk

waaah keren bangett

abis diupdate kalo

tolong tambahin

stan utbk biologi

kakkkkk

hehehehehe makasih

kakk

2 durasi videonya bikin

ga fokus

positi

f

durasi videonya bikin

ga fokus

durasi videonya

bikin ga fokus

durasi videonya

bikin ga fokus

durasi video bikin

ga fokus

durasi video bikin

ga fokus

durasi video bikin

focus

3 matematika soshumnya

kok ga ada kak di apk?

positi

f

matematika soshumnya

kok ga ada kak di apk?

matematika

soshumnya kok ga

ada kak di apk

matematika

soshumnya kok ga

ada kak di apk

matematika

soshumnya kok ga

ada kak di apk

matematika

soshumnya kok ga

ada kak di apk

matematika

soshumnya apk

4 saya suka belajar

dengan zenius.

penjelasan mudah

dimengerti. karena

setiap materi diajarkan

mulai dari dasarnya

sampai komplek.

pembahasan soal soal

positi

f

saya suka belajar

dengan zenius.

penjelasan mudah

dimengerti. karena

setiap materi diajarkan

mulai dari dasarnya

sampai komplek.

pembahasan soal soal

saya suka belajar

dengan zenius

penjelasan mudah

dimengerti karena

setiap materi

diajarkan mulai dari

dasarnya sampai

komplek

saya suka belajar

dengan zenius

penjelasan mudah

dimengerti karena

setiap materi

diajarkan mulai dari

dasarnya sampai

komplek

saya suka ajar

dengan zenius jelas

mudah erti karena

tiap materi ajar

mulai dari dasar

sampai komplek

bahas soal soal

mudah paham

saya suka ajar

dengan zenius jelas

mudah erti karena

tiap materi ajar

mulai dari dasar

sampai komplek

bahas soal soal

mudah paham

suka ajar zenius

mudah erti materi

ajar dasar komplek

bahas soal mudah

paham zennnnius

rekomended bangat

pakai ajar thanks

zeniussssssss

71

N

o


Regexp

Normalization:

Emoticon

Indonesian

Stemming

Transformation: Not

(Negative)

Indonesian Stop

word removal

mudah dipahami.

zennnnius rekomended

bangat buat dipakai

belajar setiap harinya.

thanks zeniussssssss.

mudah dipahami.

zennnnius rekomended

bangat buat dipakai

belajar setiap harinya.

thanks zeniussssssss.

pembahasan soal

soal mudah

dipahami zennnnius

rekomended bangat

buat dipakai belajar

setiap harinya

thanks zeniussssssss

pembahasan soal

soal mudah

dipahami zennnnius

rekomended bangat

buat dipakai belajar

setiap harinya

thanks zeniussssssss

zennnnius

rekomended bangat

buat pakai ajar tiap

hari thanks

zeniussssssss

zennnnius

rekomended bangat

buat pakai ajar tiap

hari thanks

zeniussssssss

5 min kok blum ada to

buat utbk lagii ya min??

positi

f

min kok blum ada to

buat utbk lagii ya min??

min kok blum ada to

buat utbk lagii ya

min

min kok blum ada to

buat utbk lagii ya

min

min kok blum ada to

buat utbk lagi ya

min

min kok blum ada to

buat utbk lagi ya

min

min blum to utbk

min

6 i love u zenius,

terimakasih

positi

f

i love u zenius,

terimakasih

i love u zenius

terimakasih

i love u zenius

terimakasih

i love u zenius

terimakasih

i love u zenius

terimakasih

love u zenius

terimakasih

7 thank you, zenius meski

update, zenius jgn

prnah hapus yg ada ya.

sukses bareng zenius!

positi

f

thank you, zenius meski

update, zenius jgn

prnah hapus yg ada ya.

sukses bareng zenius!

thank you zenius

meski update zenius

jgn prnah hapus yg

ada ya sukses

bareng zenius

thank you zenius

meski update zenius

jgn prnah hapus yg

ada ya sukses

bareng zenius

thank you zenius

meski update zenius

jgn prnah hapus yg

ada ya sukses

bareng zenius

thank you zenius

meski update zenius

jgn prnah hapus yg

ada ya sukses

bareng zenius

thank you zenius

update zenius jgn

prnah hapus sukses

bareng zenius

8 apps ny zenius dh tmbh

keren, apps sudah

membantu gw, gw ank

smp tp blajar materi

sma di zen, alhasil gw

sering msk semifinal

positi

f

apps ny zenius dh tmbh

keren, apps sudah

membantu gw, gw ank

smp tp blajar materi

sma di zen, alhasil gw

sering msk semifinal

apps ny zenius dh

tmbh keren apps

sudah membantu gw

gw ank smp tp

blajar materi sma di

zen alhasil gw

apps ny zenius dh

tmbh keren apps

sudah membantu gw

gw ank smp tp

blajar materi sma di

zen alhasil gw

apps ny zenius dh

tmbh keren apps

sudah bantu gw gw

ank smp tp blajar

materi sma di Zen

alhasil gw sering

apps ny zenius dh

tmbh keren apps

sudah bantu gw gw

ank smp tp blajar

materi sma di zen

alhasil gw sering

apps ny zenius dh

tmbh keren apps

bantu gw ank smp

blajar materi sma

zen alhasil msk

semifinal bbrp

72

N

o


Regexp

Normalization:

Emoticon

Indonesian

Stemming

Transformation: Not

(Negative)

Indonesian Stop

word removal

bbrp lomba fisika

makasih bgt,yg blm

download gk bakal rugi

lh soalny keren banget

bbrp lomba fisika

makasih bgt,yg blm

download gk bakal rugi

lh soalny keren banget

sering msk

semifinal bbrp

lomba fisika

makasih bgt yg blm

download gk bakal

rugi lh soalny keren

banget

sering msk

semifinal bbrp

lomba fisika

makasih bgt yg blm

download gk bakal


banget

msk semifinal bbrp

lomba fisika

makasih bgt yg blm

download gk bakal


banget

msk semifinal bbrp

lomba fisika

makasih bgt yg blm

download gk bakal


banget

lomba fisika

makasih download

gk rugi lh soalny

keren banget

9 sukaa positi

f

sukaa sukaa sukaa sukaa sukaa Sukaa

10 aplikasi nya sangat

berguna. cocok untuk

dirumahaja.

positi

f

aplikasi nya sangat

berguna. cocok untuk

dirumahaja.

aplikasi nya sangat

berguna cocok

untuk dirumahaja

aplikasi nya sangat

berguna cocok

untuk dirumahaja

aplikasi nya sangat

guna cocok untuk

dirumahaja

aplikasi nya sangat

guna cocok untuk

dirumahaja

aplikasi cocok

dirumahaja

11 mantappu jiwa positi

f

mantappu jiwa mantappu jiwa mantappu jiwa mantappu jiwa mantappu jiwa mantappu jiwa

12 zenius, terima kasih. positi

f

zenius, terima kasih. zenius terima kasih zenius terima kasih zenius terima kasih zenius terima kasih zenius terima kasih

13 ternyata merusak

negara indonesia

negati

f

ternyata merusak

negara indonesia

ternyata merusak

negara indonesia

ternyata merusak

negara indonesia

nyata rusak negara

Indonesia

nyata rusak negara

indonesia

nyata rusak negara

indonesia

14 suarannya putus putus negati

f

suarannya putus putus suarannya putus

putus

suarannya putus

putus

suar putus putus suar putus putus suar putus putus

15 kan banyak yang gratis,

tinggal akses youtube

begitu... apalagi ini

negati

f

kan banyak yang gratis,

tinggal akses youtube

begitu... apalagi ini

kan banyak yang

gratis tinggal akses

youtube begitu

kan banyak yang


youtube begitu

kan banyak yang


youtube begitu

kan banyak yang


youtube begitu


youtube manfaat

sempit buset

73

N

o


Regexp

Normalization:

Emoticon

Indonesian

Stemming

Transformation: Not

(Negative)

Indonesian Stop

word removal

memanfaatkan

kesempatan dalam

kesempitan... buset...

uninstall ! jaman

corona begini tolong

dong dipakai hati

nurani nya. jangan

seperti babelo yang duit

duit duit melulu di

otaknya. jadi muak saya

nya !

memanfaatkan

kesempatan dalam

kesempitan... buset...

uninstall ! jaman


dong dipakai hati

nurani nya. jangan

seperti babelo yang duit

duit duit melulu di

otaknya. jadi muak saya

nya !

apalagi ini

memanfaatkan

kesempatan dalam

kesempitan buset

uninstall jaman


dong dipakai hati

nurani nya jangan

seperti babelo yang

duit duit duit melulu

di otaknya jadi

muak saya nya

apalagi ini

memanfaatkan

kesempatan dalam

kesempitan buset

uninstall jaman


dong dipakai hati

nurani nya jangan

seperti babelo yang

duit duit duit melulu

di otaknya jadi

muak saya nya

apalagi ini manfaat

sempat dalam

sempit buset

uninstall jam corona

begini tolong dong

pakai hati nurani

nya jangan seperti

babelo yang duit

duit duit melulu di

otak jadi muak saya

nya

apalagi ini manfaat

sempat dalam

sempit buset


begini tolong dong

pakai hati nurani

nya jangan seperti

babelo yang duit

duit duit melulu di

otak jadi muak saya

nya


tolong pakai hati

nurani babelo duit

duit duit melulu

otak muak

16 uangguru...gagagugu..je

lek klah ama

youtube+gogle..kakaen

babarengan didi istana

negati

f

uangguru...gagagugu..je

lek klah ama

youtube+gogle..kakaen

babarengan didi istana

uangguru gagagugu

jelek klah ama

youtube gogle

kakaen babarengan

didi istana

uangguru gagagugu

jelek klah ama

youtube gogle

kakaen babarengan

didi istana

uangguru gagagugu

jelek klah ama

youtube gogle

kakaen babarengan

didi istana

uangguru gagagugu

jelek klah ama

youtube gogle

kakaen babarengan

didi istana

uangguru gagagugu

jelek klah youtube

gogle kakaen

babarengan didi

istana

17 5.6 t negati

f

5.6 t t t t t T

18 mantan stafsus koplak negati

f

mantan stafsus koplak mantan stafsus

koplak

mantan stafsus

koplak

mantan stafsus

koplak

mantan stafsus

koplak

mantan stafsus

koplak

19 kirain punya lokal,

rupanya singapura. bye!

negati

f

kirain punya lokal,

rupanya singapura. bye!

kirain punya lokal

rupanya singapura

kirain punya lokal

rupanya singapura

kirain punya lokal

rupa singapura bye

kirain punya lokal

rupa singapura bye

kirain lokal rupa

singapura bye

74

N

o


Regexp

Normalization:

Emoticon

Indonesian

Stemming

Transformation: Not

(Negative)

Indonesian Stop

word removal

bye bye

20 asli sampah. banyak

banget iklan. bangsat

negati

f

asli sampah. banyak

banget iklan. bangsat

asli sampah banyak

banget iklan bangsat

asli sampah banyak


asli sampah banyak


asli sampah banyak


asli sampah banget

iklan bangsat

21 #mendingzenius negati

f

#mendingzenius mendingzenius mendingzenius mendingzenius mendingzenius Mendingzenius

22 apaan nih, kok gabisa

buat main gta v!?!?

negati

f

apaan nih, kok gabisa

buat main gta v!?!?

apaan nih kok

gabisa buat main gta

v

apaan nih kok

gabisa buat main gta

v

apa nih kok gabisa

buat main gta v

apa nih kok gabisa

buat main gta v

gabisa main gta v

23 aplikasi

#bukankaryaanakbangs

a

negati

f

aplikasi

#bukankaryaanakbangs

a

aplikasi

bukankaryaanakban

gsa

aplikasi

bukankaryaanakban

gsa

aplikasi

bukankaryaanakban

gsa

aplikasi

bukankaryaanakban

gsa

aplikasi

bukankaryaanakban

gsa

24 parah guru les

privatnya

negati

f

parah guru les

privatnya

parah guru les

privatnya

parah guru les

privatnya

parah guru les privat parah guru les privat parah guru les privat

25 yang penting proyek

5,6t lancar walau keluar

dari stafsus. mantap

negati

f

yang penting proyek

5,6t lancar walau keluar

dari stafsus. mantap

yang penting proyek

t lancar walau

keluar dari stafsus

mantap

yang penting proyek

t lancar walau

keluar dari stafsus

mantap

yang penting proyek

t lancar walau

keluar dari stafsus

mantap

yang penting proyek

t lancar walau

keluar dari stafsus

mantap

proyek t lancar

stafsus mantap

26 sdh pake kuota

telkomsel tetapi kuota

utama msh kepotong

juga

negati

f

sdh pake kuota

telkomsel tetapi kuota

utama msh kepotong

juga

sdh pake kuota

telkomsel tetapi

kuota utama msh

kepotong juga

sdh pake kuota

telkomsel tetapi

kuota utama msh

kepotong juga

sdh pake kuota

telkomsel tetapi

kuota utama msh

potong juga

sdh pake kuota

telkomsel tetapi

kuota utama msh

potong juga

sdh pake kuota

telkomsel kuota

utama msh potong

analisa sentimen terhadap aplikasi - repository bsi

Documents