pengukuran kinerja layanan jaringan komputer untuk ... · bagaimana membuat sistem. manajemen...

26
TESIS TE092099 Oleh : Sri Wulandari

Upload: vuongtram

Post on 25-Apr-2019

235 views

Category:

Documents


0 download

TRANSCRIPT

TESIS – TE092099

Oleh : Sri Wulandari

Saat ini kemajuan dalam penerapan teknologi informasi di lingkunganPemerintah Kota Surabaya telah menuju ambang critical mission,dimana hampir seluruh aspek kegiatan birokrasi, administrasi, sertalayanan masyarakat menggunakan aplikasi /sistem informasi secarapenuh.

Beberapa contoh penerapan aplikasi/SIM :

musyawarah rencana pembangunan (MUSRENBANG)

perencanaan kegiatan (e-Project)

perencanaan anggaran (e-Budgeting)

pengadaan barang dan jasa (e-Procurement)

pengelolaan lelang dan swakelola (e-Delivery)

penyerapan anggaran (e-Controlling)

pemantauan kinerja SKPD (ePerformance)

Bagaimana membuat sistem manajemen ketersediaan untuk jaringan komputer berdasarkan framework ITIL.

Apakah dengan penerapan sistemmanajemen tersebut dapat secara signifikan mengurangi downtime.

Data yang digunakan dalam penelitian ini adalah data insiden (history) yang terjadi pada periode Januari 2011 sampai dengan Desember 2011 di lokasi jaringan berbasis Wireless/Radio Pemerintah Kota Surabaya.

Membuat rancangan sistem manajemenketersediaan yang mampu meningkatkanketersediaan layanan jaringan komputer.

Meningkatkan ketersediaan layanan jaringan komputer.

Mengurangi downtime pada layanan jaringankomputer.

Mengurangi frekuensi kegagalan padajaringan komputer.

Selesai

ITIL

v3

Reactive Activities

Proactive Activities

Pengumpulan

Informasi

Monitoring, mengukur dan

menganalisa report dan review

ketersediaan layanan & komponen

Mulai

Kesimpulan

Merencanakan dan mendesain

sistem manajemen ketersediaan

Untuk membantu menguraikan masalah tersebutdigunakan kerangka kerja tata kelola TI yaitu ITIL (Information Technology of Infrastructure Library) khususnya penerapan proses ‘Availability Management’ untuk kegiatan layanan jaringan diPemerintah Kota Surabaya.

ITIL Availability Management bertujuan untukmenetapkan, menganalisa, merencanakan, mengukur dan meningkatkan ketersediaanlayanan TI. Availability Management bertanggung jawab untuk memastikankeseluruhan TI (infrastruktur, proses-proses, kebijakan-kebijakan) sesuai dengantarget yang ditetapkan.

‘Reactive Activities’, aspek reaktif dari pengelolaanketersediaan layanan melibatkan aktifitas pemantauan, pengukuran, analisa dan manajemen keseluruhan kejadian, insiden masalah terkait hilangnya ketersediaan. Aktifitas-aktifitas tersebut pada prinsipnya terkait dengan operasionalroles.

‘Proactive Activities’, melibatkan aktifitas perencanaan, desaindan usaha-usaha peningkatan ketersediaan. Aktifitastersebut pada prinsipnya terkait dengan perencanaan dandesain.

Availability dipengaruhi oleh 3 faktor, yaitu :

Frekuensi dari downtime

Durasi dari downtime

Dampak (scope of impact)

Availability dapat dihitung dengan menggunakan rumus :

AV (%) = (AST – DT / AST) x 100%

dengan :

AST = Agreed Service Time

DT = Down Time

Proses awal dalam manajemen ketersediaan adalah reactive activities meliputi :

- Monitoring

- Pengukuran

- Menganalisa & memanajemen semua

kejadian, termasuk insiden maupun

permasalahan terkait ketidak-ketersediaan

Device Location

Total Poll

Time

(minutes)

Time Un-

available

(minutes)

Percent

Available

Switch 131032,66 2743,56 97,91

BW-JT BW 131032,73 2913,60 97,78

LS-BW LS 131035,35 3615,49 97,24

SK-BW SK 131034,29 6245,48 95,23

PK-BW PK 131036,19 6527,67 95,02

GB-DC GB 131035,56 2975,55 97,73

BJ-DC BJ 131035,25 37776,06 71,17

SL-BM SL 131036,38 4476,49 96,58

LP-BM LP 131026,91 37397,35 71,46

GA-RK GA 131035,72 9237,58 92,95

PMK-BT PMK 131035,09 4835,62 96,31

KR-BT KR 131035,03 4875,59 96,28

SW-BT SW 131034,87 4885,67 96,27

AR-BT AR 131036,42 5556,84 95,76

SM-JT SM 131034,88 6586,69 94,97

TS-SM TS 131035,89 6437,14 95,09

GT-SM GT 131035,83 6797,22 94,81

SP-SM SP 131035,56 7397,09 94,35

TGL-SW TGL 131026,93 6988,02 94,67

DK-SW DK 131036,38 9147,82 93,02

DP-SW DP 131037,20 15190,50 88,41

DS-SW DS 131026,01 31654,53 75,84

KP-JB KP 131035,63 12848,48 90,19

WY-JB WY 131035,78 18890,63 85,58

KOP-DH KOP 131036,35 13479,29 89,71

MR-JT MR 131032,37 9525,67 92,73

BLK-MR BLK 131035,46 39187,80 70,09

KJR-BLK KJR 131037,01 61145,96 53,34

76,09%

90,66%

65,00%

70,00%

75,00%

80,00%

85,00%

90,00%

95,00%

Jan-Jun Jul-Des

Availability

7,94

43,24

0,00

5,00

10,00

15,00

20,00

25,00

30,00

35,00

40,00

45,00

50,00

Jan-Jun Jul-Des

MTBF

(Mean Time Between Failure)

2,41

1,93

0,00

0,50

1,00

1,50

2,00

2,50

3,00

Jan-Jun Jul-Des

MTTR

(Mean Time To Recovery/Repair)

Sering terjadinya downtime pada jaringan MAN akan menimbulkan dampak dan implikasi sebagai berikut :

Timbulnya ketidaknyamanan/ketidakpuasan pengguna dalam hal ini SKPD yang melayani masyarakat secara langsung.

Masyarakat pun menjadi tidak puas dan merasa dirugikan dari segi material dan non-material atas waktu yang terbuang.

Kerugian finansial bagi pemerintah kota, bila terdapat layanan yang berhubungan dengan pembayaran pajak atau retribusi.

Reputasi buruk atas kinerja pemerintah kota.

Berdasarkan data insiden, yang menjadi penyebab utama terjadinya downtime adalah :

Catu daya listrik mati,

Perangkat (swicth, router, wireless/radio) tidak bekerjasebagaimana mestinya (malfunction), disebabkan oleh:

a. Ketidak-stabilan atau lonjakan tegangan listrik

b. Beban traffic yang tinggi (overload)

c. Induksi petir

d. Hujan disertai angin kencang.

Maintenance atau perubahan konfigurasi perangkat jaringan yang terkait.

Identifikasi Fungsi Bisnis Vital (VBF)

Rancangan Ketersediaan

Solusi khusus dengan redundansi penuh

Analisa Kegagalan Perangkat Tunggal (SPof)

Component Failure Impact Analysis (CFIA)

Fault Tree Analysis (FTA)

Pemodelan (Modelling)

Analisis Risiko dan Manajemen Risiko

PRIORITAS LAYANAN

1 KTP On-line

2 Koneksi Internet

3 Sistem Informasi

4 CCTV

5 VoIP

6 Video Conference

Redesain Topologi Jaringan

Re-konfigurasi Peralatan

Penggunaan VPN untuk Redudansi

Salah satu penyebabterjadinya penurunan kinerjaadalah IP gateway yang terletak di luar jaringan LAN SKPD, yaitu berada padacore layer.

Hal ini menyebabkan banyaknyapaket yang tidak seharusnyamemasuki jaringan layer distribusi dan core, sehinggakinerja jaringan secarakeseluruhan sering mengalamimasalah, dan dilakukan restart peralatan.

Ada 2 komponen utama yang saat ini masih tercatatdalam kategori Single Point of Failure (SpoF), ataudalam kata lain komponen tersebut tidak adaperalatan yang membackup atau memilikikemampuan fail-over, yaitu Switch Utama danFortigate (perangkat IPS/Intrusion Prevention System).

Dengan menerapkan re-desain konfigurasiperangkat dan topologi, fungsi keduanya akansegera dapat digantikan bila terjadi kegagalan. Padaswitch utama akan tersedia switch pendampingyang berfungsi untuk redundansi, sedangkanketergantungan akan perangkat Fortigate akansemakin menurun dengan dipasangnya router padamasing-masing LAN.

Sistem Manajemen Ketersediaan dengan framework ITIL secara umum dapat meningkatkan ketersediaan jaringan komputer Pemerintah Kota, ini dibuktikan bahwa dari sistem manajemen yang dibuat, baru sebagian yang telah dilaksanakan oleh Dinas Kominfo, namun hasilnya telah memberikan kontribusi pada ketersediaan yang cukup signifikan. Hal tersebut ditandai dengan meningkatnya prosentase ketersediaan jaringan selama semester pertama sebesar 76,09% menjadi 90,06% di semester kedua.

Mengenai naik-turunnya nilai MTTR, bisa dijelaskan bahwa sampai saat ini tidak semua komponen memiliki peralatan redudansi disamping proses pen-dokumentasian mengenai desain, topologi, peralatan, dan konfigurasi peralatan jaringan yang masih terus dilakukan. Sehingga ketika terjadi insiden, waktu yang dibutuhkan cukup lama. Hal ini terlihat pada analisa pengamatan selama 6 bulan pertama, waktu rata-rata perbaikan/pemulihan sebesar 2,41 jam, lebih lama dibandingkan waktu rata-rata perbaikan/pemulihan 6 bulan terakhir yaitu 1,93 jam.

Sedangkan untuk lonjakan nilai MTBF (Mean Time Betwen Failure) pada akhir penelitian dipengaruhi pada implementasi koneksi redundansi (VPN) yang menjadi koneksi utama (primary) menggantikan koneksi wireless/radio yang dijadikan sebagai koneksi cadangan (secondary).

Permasalahan catu daya listrik, dan kondisi cuaca memberikan andil terbesar terjadinya downtime.

1. Perlu pembenahan dokumentasi mengenai desain, topologi, peralatan dan konfigurasi peralatan yang lengkap dan sistematis, dan didukung penanganan insiden dengan service desk yang memadai untuk mempercepat penyelesaian masalah bila terjadi downtime. Lebih baik lagi apabila ditambahkan sistem informasi manajemen ketersediaan untuk memberikan kemudahan dan kecepatan dalam menganalisa insiden pada jaringan.

2. Terkait permasalahan sumber daya listrik, karena terkait lintas sektoral dan dinas perlu adanya koordinasi menyeluruh terhadap penanganan sistem kelistrikan di seluruh kantor Pemerintah Kota.

3. Pada perangkat yang masih dalam daftar SPoF, yaitu Switch Utama dan Fortigate ditinjau dari dampak yang ditimbulkan bila terjadi kegagalan, maka harus segera disiapkan peralatan pengganti/cadangannya. Khusus untuk switch utama mengingat perannya sebagai jantung jaringan komputer MAN, perlu kiranya diadakan peralatan dengan kemampuan fail over secara otomatis. Sedangkan untuk penanganan masalah malware, perlu dilakukan kajian mengenai penggunaan IPS yang didukung/dikombinasikan dengan kebijakan penggunaan antivirus atau internet security di lingkungan Pemerintah Kota.