m3111053 doni bawono d3ti fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v abstrak doni...

15
perpustakaan.uns.ac.id digilib.uns.ac.id commit to user NIM. M3111053 PROGRAM STUDI DIPLOMA III TEKNIK INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2014

Upload: others

Post on 29-Oct-2019

17 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

NIM. M3111053

PROGRAM STUDI DIPLOMA III TEKNIK INFORMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET

SURAKARTA

2014

Page 2: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 3: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

Page 4: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

iv

ABSTRACT

DONI BAWONO. M3111053. HADOOP DISTRIBUTED FILE SYSTEM IMPLEMENTATION IN CLUSTER SERVER. Diploma of Information Engineering, Faculty of Natural Sciences and Metematika, Univertas of March, June 2014.

Nowdays, the growth of data so quickly, within a few years the amount of

data that must be managed by a leading IT firms in the world can reach the size of

Peta Byte. If the management of large data is not matched by the management of

the storage media (server) that will adequately reduce productivity.

One technology that offered to handle the data growth rate with the storage

media is HDFS (Hadoop Distributed File System) which adopts the GFS (Google

File System) with the level of effectiveness in terms of storage media and

economic factors. HDFS uses the concept of data blocks of a file are stored in

multiple machines connected together in a cluster.

Implementation of HDFS as an effective alternative storage media with a

simple infrastructure which uses commodity hardware that is relatively affordable

compared to a server with the same capabilities.

Keywords: Hadoop, HDFS, GFS, MapReduce,DFSIO

Page 5: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

v

ABSTRAK

DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER. Diploma III Teknik Informatika, Fakultas Metematika dan Ilmu Pengetahuan Alam, Univertas Sebelas Maret, Juni 2014.

Saat ini pertumbuhan data begitu cepat, dalam beberapa tahun saja jumlah

data yang harus dikelola oleh perusahan-perusahaan IT terkemuka didunia bisa

mencapai ukuran Peta Byte. Jika pengelolaan data yang besar ini tidak diimbangi

dengan pengelolaan media penyimpanan (server) yang memadai maka akan

mengurangi produktifitas.

Salah satu teknologi yang ditawarkan untuk menangani laju pertumbuhan

data dengan media penyimpanan adalah HDFS (Hadoop Distributed File System)

yang mengadopsi GFS (Google File System) dengan tingkat efektifitas dari segi

media penyimpanan dan faktor ekonomi. HDFS menggunakan konsep blok-blok

data dari sebuah file yang disimpan dalam beberapa mesin yang saling terhubung

dalam sebuah cluster.

Penerapan dari HDFS sebagai alternative media penyimpanan yang efektif

dengan infrastruktur yang sederhana dimana menggunakan hardware komoditas

yang relative terjangkau dibandingkan sebuah server kebanyakan dengan

kemampuan yang sama.

Katakunci: Hadoop, HDFS, GFS, MapReduce, DFSIO

Page 6: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

vi

MOTTO

harta. Ilmu itu penghukum (hakim) dan harta terhukum. Harta itu kurang apabila

:: Khalifah Ali bin Abi Talib ::

-besarnya, tapi bersegeralah untuk mengerjakan

sekecil-kecilnya ke

:: Mario Teguh ::

-orang sukses yang saya kenal adalah mereka yang lebih banyak

:: Bernard M Baruch ::

Page 7: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

vii

HALAMAN PERSEMBAHAN

Yang Pertama dan Utama

Alhamdulillah, Segala puji hanya milik Allah S.W.T yang telah menganugerahkan kelapangan, kesempatan, dan kemampuan untuk menyelesaikan Tugas Akhir ini.

Tidak ada kata yang lebih pantas, melainkan rasa syukur dari lubuk hati hamba yang terdalam

Kedua OrangtuKu

Terimaksih untuk bapak dan ibu yang tak kenal lelah selalu menasehati dan memberikan dukungan terhadap pengerjaan Tugas Akhir ini

Kedua AdiKu

Untuk kedua adikKu dukungan dan semangat dalam menimba ilmu, semoga bisa

menjadi pelajaran berharga sebagai bekal hidup di dunia ini.

Dosen Pembimbing

Terimakasih, Bapak Rudi Hartono, S.Si atas segala bantuan dan bimbingannya selama pengerjaan laporan Tugas Akhir ini sehingga selesai pada waktunya

Sahabat Sahabatku

Terimaksih atas ceita yang telah kalian torehkan dalam catatan hidupKu yang sangat berarti dan berharga selama ini.

Doni Bawono

Page 8: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

viii

KATA PENGANTAR

Puji syukur penulis panjatkan kehadirat Allah S.W.T atas limpahan

rahmatNya, sehingga penyusunan Laporan Tugas Akhir dengan judul

Implementasi Hadoop Distributed File System dalam Cluster Server ini dapat

terselesaikan pada waktunya tanpa halangan berarti.

Penyusunan laporan ini bertujuan untuk memenuhi sebagian persyaratan

mencapai derajat Diploma III Teknik Informatika Fakultas Matematika dan Ilmu

Pengetahuan Alam Universitas Sebelas Maret Surakarta.

Dalam penyusunan Laporan Tugas Akhir ini penulis mendapatkan bantuan

dan dukungan dari berbagai pihak. Oleh sebab itu pada kesempatan ini, penulis

mengucapkan terima kasih kepada semua pihak yang telah memberikan bantuan

dan dukungannya, terutama kepada:

1. Ir. Ari Handono Ramelan, M.Sc. (Hons), Ph.D selaku Dekan Fakultas

Matematika dan Ilmu Pengetahuan Alam Universitas Sebelas Maret Surakarta

yang telah memberikan kesempatan belajar di lingkungan FMIPA UNS.

2. Bapak Drs. Y. S. Palgunadi, M.Sc. selaku Ketua Program Studi Diploma III

Teknik Informatika Fakultas Matematika dan Ilmu Pengetahuan Alam

Universitas Sebelas Maret Surakarta yang telah memberikan kesempatan

belajar di program studi D3 Teknik Informatika.

3. Bapak Rudi Hartono, S.Si selaku Dosen Pembimbing Tugas Akhir yang telah

memberikan bimbingan, pengarahan, kritik, dan saran serta dukungan selama

penyusunan Laporan Tugas Akhir ini.

4. Ayah dan Ibu tercinta yang telah banyak memberikan dukungan dan masukan

yang membangun.

5. Semua pihak terkait yang tidak bisa saya sebutkan satu persatu, atas bantuan

dan dukungannya selama penulis belajar di D3 Teknik Informatika.

Page 9: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

ix

Semoga Allah S.W.T memberikan balasan yang lebih baik kepada pihak-

pihak yang telah memberikan bantuan dan dukungan dari awal penulis belajar di

D3 Teknik Informatika sampai berakhirnya penyusunan Laporan Tugas Akhir ini

selesai.

Semoga dengan selesainya penyusunan Laporan Tugas Akhir ini dapat

memberikan manfaat dan kebaikan pada penulis dan pembaca sekalian.

Surakarta, 15 Juni 2014

Penulis

Page 10: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

x

DAFTAR ISI

HALAMAN JUDUL ................................................................................................ i

HALAMAN PERSETUJUAN ................................................................................ ii

HALAMAN PENGESAHAN ................................................................................ iii

ABSTRACT ............................................................................................................ ii

ABSTRAK .............................................................................................................. v

MOTTO.................................................................................................................. vi

HALAMAN PERSEMBAHAN............................................................................ vii

KATA PENGANTAR ......................................................................................... viii

DAFTAR ISI ........................................................................................................... x

DAFTAR GAMBAR ........................................................................................... xiii

DAFTAR TABEL ................................................................................................. xv

BAB I PENDAHULUAN ...................................................................................... 1

1.1 Latar Belakang.......................................................................................... 1

1.2 Perumusan Masalah .................................................................................. 3

1.3 Batasan Masalah Penelitian ...................................................................... 3

1.4 Tujuan Penelitian ...................................................................................... 3

1.5 Manfaat Penelitian .................................................................................... 3

1.6 Metodologi Penelitian .............................................................................. 4

1.7 Sistematika Penulisan ............................................................................... 5

BAB II LANDASAN TEORI ................................................................................. 7

2.1 Hadoop ..................................................................................................... 7

2.2 HDFS (Hadoop Distributed File System)................................................. 9

2.2.1 Pengertian Hadoop Distributed File System ..................................... 9

2.2.1 Model data dan Struktur HDFS......................................................... 9

Page 11: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

xi

2.2.1 Prosedur Menyimpan dan membaca data dalam HDFS ................. 11

BAB III ANALISA KEBUTUHAN DAN PERANCANGAN SISTEM ............. 13

3.1 Analisa Kebutuhan Sistem ..................................................................... 13

3.2 Alur Penelitian ........................................................................................ 14

3.3 Perancangan Sistem ................................................................................ 16

3.4 Cara Analisis .......................................................................................... 16

BAB IV IMPLEMENTASI DAN ANALISIS ...................................................... 20

4.1 Instalasi Komponen dasar....................................................................... 20

4.4.1 Install JDK 7 ................................................................................... 20

4.4.1 Install Openssh-Server .................................................................... 20

4.2 Menambahkan dedicated user ................................................................ 21

4.3 Konfigurasi Jaringan .............................................................................. 21

4.3.1 Setting IP Address ........................................................................... 22

4.3.2 Akses SSH ....................................................................................... 23

4.4 Cluster Overview .................................................................................... 24

4.5 Konfigurasi Hadoop ............................................................................... 25

4.5.1 Install Hadoop ................................................................................. 25

4.5.2 Konfigurasi hadoop-env.sh (semua mesin) ..................................... 26

4.5.3 Konfigurasi conf/core-site.xml (semua mesin) ............................... 26

4.5.4 Konfigurasi conf/mapred-site.xml (semua mesin) .......................... 27

4.5.5 Konfigurasi conf/hdfs-site.xml (semua mesin) ............................... 28

4.6 Analisis ................................................................................................... 28

4.6.1 Menjalankan Multi Node Cluster .................................................... 28

4.6.2 Menghentikan Multi Node Cluster.................................................. 30

4.6.3 HDFS Formating ............................................................................ 30

4.6.4 Testing HDFS Write ........................................................................ 31

4.6.5 Testing HDFS Read......................................................................... 34

4.6.6 Files and Block ................................................................................ 35

4.6.6 HDFS Benchmark (DFSIO) Write Read ......................................... 36

BAB V PENUTUP ................................................................................................ 46

Page 12: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

xii

5.1 Kesimpulan ............................................................................................. 46

5.2 Saran ....................................................................................................... 46

DAFTAR PUSTAKA ........................................................................................... 47

LAMPIRAN .......................................................................................................... 48

Page 13: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

xiii

DAFTAR GAMBAR

Gambar 1.1 Metodologi Penelitian ........................................................................ 4

Gambar 2.1 Arsitektur Hadoop ............................................................................. 7

Gambar 2.2 Mengakses data pada HDFS ............................................................ 10

Gambar 2.3 Menyimpan data ke dalam HDFS.................................................... 11

Gambar 2.4 Membaca data yang tersimpan dalam HDFS .................................. 12

Gambar 3.1 Skema jalannya penelitian ............................................................... 14

Gambar 3.2 Perancangan Sistem ......................................................................... 16

Gambar 3.3 Skema pembagian blok data ............................................................ 17

Gambar 3.4 Skema HDFS File Write .................................................................. 18

Gambar 3.5 Skema HDFS Files Read ................................................................. 18

Gambar 4.1 Melihat versi JDK pada sistem ........................................................ 20

Gambar 4.2 Topologi Jaringan ............................................................................ 21

Gambar 4.3 Konfigurasi IP Address NodeMaster dan DataNode 1 .................... 22

Gambar 4.4 Konfigurasi IP Address DataNode 2................................................ 22

Gambar 4.5 Konfigurasi IP Address DataNode 3................................................ 22

Gambar 4.6 Akses SSH NodeMaster ke DataNode 2 ......................................... 24

Gambar 4.7 Akses SSH NodeMaster ke DataNode 3 ......................................... 24

Gambar 4.8 HDFS Cluster Overview .................................................................. 25

Gambar 4.9 Menjalankan HDFS ......................................................................... 29

Gambar 4.10 File logs/ hadoop-hduser-datanode-slave.log ................................ 29

Gambar 4.11 JPS pada master ............................................................................. 29

Gambar 4.12 JPS pada slave................................................................................ 30

Page 14: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

xiv

Gambar 4.13 Menghentikan HDFS service ......................................................... 30

Gambar 4.14 Hasil JPS setelah HDFS service dimatikan ................................... 30

Gambar 4.15 Format HDFS berhasil ................................................................... 31

Gambar 4.16 skema HDFS Write ........................................................................ 31

Gambar 4.17 Proses HDFS Write pada DataNode pertama ................................ 32

Gambar 4.18 Proses HDFS Write pada DataNode kedua ................................... 33

Gambar 4.19 Proses HDFS Write pada DataNode ketiga ................................... 33

Gambar 4.20 DFS manajemen............................................................................. 33

Gambar 4.21 Blok ID disetiap node .................................................................... 34

Gambar 4.22 Skema HDFS File Write ................................................................ 34

Gambar 4.23 HDFS File Blok Read node pertama ............................................. 35

Gambar 4.24 HDFS File Blok Read node kedua ................................................. 35

Gambar 4.25 HDFS File Blok Read node ketiga ................................................ 35

Gambar 4.26 HDFS Files and Data Block .......................................................... 35

Gambar 4.27 Grafik DFSIO Write (throughput) percobaan I ............................. 37

Gambar 4.28 Grafik DFSIO Write (throughput) percobaan II ............................ 38

Gambar 4.29Grafik DFSIO Write (time) percobaan I ......................................... 39

Gambar 4.30 Grafik DFSIO Write (time) percobaan II ....................................... 40

Gambar 4.31 Grafik DFSIO Read (throughput) percobaan I .............................. 42

Gambar 4.32 Grafik DFSIO Read (throughput) percobaan II............................. 43

Gambar 4.33Grafik DFSIO Read (time) percobaan I .......................................... 44

Gambar 4.34Grafik DFSIO Read (time) percobaan II ........................................ 45

Page 15: M3111053 Doni Bawono D3TI fileperpustakaan.uns.ac.id digilib.uns.ac.id commit to user v ABSTRAK DONI BAWONO. M3111053.IMPLEMENTASI HADOOP DISTRIBUTED FILE SYSTEM DALAM CLUSTER SERVER

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

xv

DAFTAR TABEL

Tabel 4.1 DFSIO Write (throughput) percobaan I ............................................... 37

Tabel 4.2 DFSIO Write (throughput) percobaan II .............................................. 38

Tabel 4.3 DFSIO Write (time) percobaan I .......................................................... 39

Tabel 4.4 DFSIO Write (time) percobaan II ......................................................... 40

Tabel 4.5 DFSIO Read (throughput) percobaan I ................................................ 41

Tabel 4.6 DFSIO Read (throughput) percobaan II ............................................... 42

Tabel 4.7 DFSIO Read (time) percobaan I ........................................................... 44

Tabel 4.8 DFSIO Read (time) percobaan II.......................................................... 45