bab 2 fix - library.binus.ac.idlibrary.binus.ac.id/ecolls/ethesisdoc/bab2/2010-1-00711-si-bab...

BAB 2

LANDASAN TEORI

2.1. Teori-Teori Umum

2.1.1. Pengertian Data

Menurut O’Brien (2005,p38)data adalah fakta atau observasi mentah yang

biasanya mengenai transaksi bisnis.

2.1.2. Pengertian Informasi

Menurut McLeod and Schell (2001,p12), informasi merupakan data yang

telah diproses atau data yang memiliki makna.

2.1.3. Pengertian Database

Menurut Connoly dan Begg (2005,p15), database adalah kumpulan data-data

yang saling berhubungan satu sama lain yang digunakan secara bersama-sama dan

dirancang untuk memenuhi kebutuhan informasi perusahaan atau organisasi.

2.1.4. Pemodelan Entity Relationship

Menurut Connoly dan Begg (2005,p342), pemodelan ER adalah pendekatan

dari atas ke bawah untuk merancang database yang dimulai dengan

mengidentifikasi data yang penting yang dikenal dengan sebutan entitas dan

hubungan antara data harus diperlihatkan dalam model ini. Konsep dasar dari

pemodelan ER antara lain:

a) Entitas (Entity)

Menurut Connoly dan Begg (2005,p343), entity type adalah sekumpulan

objek dengan properti yang sama, dimana diidentifikasikan oleh perusahaan

karena mempunyai keadaan bebas. Menurut Connoly dan Begg (2005,

p333), entity occurence adalah objek yang didefinisikan secara unik dari

entity type. Entity type digambarkan dalam bentuk bujur sangkar dengan

diberi nama entitas, yang umumnya adalah kata benda tunggal, dapat dilihat

pada gambar 2.1

Gambar 2.1 Diagram dari Entity Type Branch dan Staff

(Sumber : Connoly dan Begg, 2005, p345)

b) Hubungan (Relationship)

Menurut Connoly dan Begg (2005, p346), relationship type adalah

sekumpulan asosiasi berarti antara entity types.

Setiap relationship type digambarkan dengan garis yang menghubungkan

entity type, dan diberi nama hubungannya seperti pada gambar 2.2 Pada

umumnya, hubungannya menggunakan kata kerja atau frase pendek yang

mengandung kata kerja. Jika memungkinkan, nama hubungannya harus

bersifat unik. Secara umum, nama hubungan hanya mempunyai arti untuk

satu arah saja. Contohnya : pada gambar dibawah ini menyatakan bahwa

Branch memilliki Staff.

Gambar 2.2 Diagram dari Relationship Type Branch mempunyai Staff

(Sumber : Connoly dan Begg ,2005, p347)

c) Atribut (Attribute)

Menurut Connoly dan Begg (2005, p350), atribut adalah properti dari

sebuah entitas atau relationship type. Contohnya, Staff memiliki atribut

StaffNo, nama, posisi, dan gaji.

d) Multiplicity

Menurut Connoly dan Begg (2005, p356), multiplicity adalah sejumlah

kemunculan yang mungkin ada dalam sebuah entitas yang berhubungan

dengan kemunculan tunggal dari entitas yang berhubungan dengannya.

Tiga tipe hubungan multiplicity adalah :

• 1:1 (One-to-One)

Contoh dari hubungan ini ádalah :

Gambar 2.3 Multiplicity hubungan satu ke satu dari staff yang mengatur Branch

(Sumber : Connoly dan Begg,2005, p358)

Artinya, seorang staff dapat mengatur nol atau satu cabang dan

masing-masing cabang di atur oleh satu staff.

• 1:* (One-to-Many)

Contoh dari hubungan ini adalah :

Gambar 2.4 Multiplicity hubungan satu ke banyak dari staff yang mengawasi property for

rent


Artinya, seorang staff dapat mengawasi nol atau lebih properti yang

akan disewa dan sebuah properti yang akan disewa diawasi oleh nol

atau satu staff.

• *:* (Many-to-Many)

Contoh dari hubungan ini adalah :

Gambar 2.5 Multiplicity hubungan banyak ke banyak dari newspaper yang

mengiklankan property for rent


Artinya, satu koran mengiklankan satu atau lebih properti yang akan

disewa dan satu properti yang akan disewa diiklankan oleh nol atau

lebih koran.

2.1.5. Konsep Data warehouse

2.1.5.1 Pengertian Data Warehouse

Menurut Inmon (2005,p29), data warehouse merupakan kumpulan

dari database yang memiliki sifat berorientasi subjek, terintegrasi, yang

dirancang untuk dapat mendukung pengambilan keputusan dalam

organisasi, dimana tiap datanya berhubungan dengan suatu kejadian yang

terjadi pada suatu waktu tertentu.

2.1.5.2 Karakteristik Data Warehouse

Menurut Inmon (2005,p29), sebuah data warehouse memiliki

karakteristik sebagai berikut :

1. Subject Oriented

Data warehouse bersifat subject oriented berarti bahwa

data warehouse bukan berorientasikan pada proses atau fungsi

aplikasi tertentu, melainkan pada subyek-subyek tertentu dalam

perusahaan, yang mana biasanya memiliki subyek-subyek yang

unik untuk tiap perusahaannya. Misalnya : untuk perusahaan

asuransi subyeknya adalah pelanggan, kebijakan, premi, dan

keluhan; dalam pabrik subyeknya adalah produk, pesanan, vendor,

tagihan material, bahan baku; dan sebagainya.

Gambar 2.6 Aspek Subject Oriented dari Data Warehouse

(Sumber : Inmon, 2005, p30)

2. Integrated

Karakteristik integrasi ini dapat dikatakan merupakan aspek

terpenting dari data warehouse. Integrasi disini dimaksudkan

bahwa data dalam data warehouse memiliki satu bentuk tunggal

fisikal yang sama dan konsisten walau berasal dari sumber yang

berbeda-beda. Termasuk juga konsistensi pada aplikasi yang

mengaksesnya, aturan pengentrian data, aturan penamaan atribut,

dan karakteristik fisikal data lainnya. Jadi pengkodean pada data

warehouse dilakukan secara konsisten tanpa terpengaruh pada

metode maupun sumber aplikasinya berjalan seperti

bagaimanapun.

Gambar 2.7 Integrasi Data Warehouse


3. Time Variant

Variasi waktu disini diartikan bahwa data di dalam sebuah

data warehouse berhubungan dengan suatu titik atau point dalam

suatu periode waktu tertentu. Misalnya semester, kwartalan, tahun

fiskal, atau periode pembayaran. Sebagai contoh, data yang

menunjukkan penjualan produk yang terlaris per tahun, jumlah

pembelian per kwartal, dan sebagainya.

Tabel 2.1 Perbandingan time variant antara data opersional dan data warehouse

(Inmon, 2005, p32)

Data Operasional Data Warehouse

Mempunyai time horizon 60 - 90

hari

Mempunyai time horizon 5 - 10

tahun

Data atau record dapat di-update

Data atau record tidak dapat di-

update

Key structure dapat termasuk atau

tidak termasuk elemen waktu

Key structure termasuk elemen

waktu

4. Nonvolatile (Tidak dapat berubah)

Karakteristik data warehouse nonvolatile dapat diartikan

bahwa ketika data sudah disimpan ke dalam sebuah data

warehouse, data harus tidak boleh berubah atau tidak boleh ada

perubahan didalamnya.

Gambar 2.8 Aspek Non-Volatile dari Data Warehouse


2.1.5.3 Struktur Data Warehouse

Data warehouse mempunyai struktur yang spesifik dan

mempunyai perbedaan dalam tingkatan ringkasan (summary) dan detail

data serta perbedaan dalam tingkatan umur data. Menurut

Inmon(2005,p33) terdapat beberapa level of detail yang berbeda dalam

dalam data warehouse, yaitu :

• Current detail data (data detail saat ini)

• Old detail data (data detail historis)

• Lightly summarized data (data ringkasan level menengah)

• Highly summarized data (data ringkasan level tinggi)

METADATA

OperationalTransformation

Old Detail

Current Detail

Lightly Summarized(Data Mart)

HighlySummarized

Gambar 2.9 Struktur Data Warehouse


1. Current detailed data

Pada bagian ini current detail data disimpan dalam skema

database. Data ini tidak disimpan secara langsung, tetapi data ini

ditambahkan dalam warehouse untuk melengkapi data yang

terkumpul. Data ini menjadi berguna saat detil data terkumpul pada

tahap berikutnya.

2. Old detailed data

Old detailed data merupakan data detil dan ringkas yang

berguna untuk arsip dan back up. Meskipun ringkasan data atau

summary didapat dari current detailed data, tetapi masih

memungkinkan untuk menyimpan ringkasan data tersebut secara

langsung jika data berada diluar periode current detailed data.

Data disimpan dalam sebuah penyimpanan seperti magnetic tape

atau optical disk.

3. Lightly summarized data

Lightly summarized data merupakan data ringkasan atau

summary dari current detailed data. Pada tingkat ini, data hasil

ringkasan masih belum dapat digunakan dalam proses

pengambilan keputusan karena belum bersifat ‘total summary’ dan

menjadi bersifat rinci.

Lightly summarized data biasanya sering digunakan untuk

gambaran dari keadaan yang sedang berlangsung dan sudah

berlangsung.

4. Highly summarized data

Highly summarized data merupakan hasil proses summary

yang bersifat ‘totalitas’. Data pada highly summarized ini sangat

mudah diakses. Data pada tingkat inilah yang pada akhirnya

digunakan untuk mendukung pengambilan keputusan terutama

dikalangan eksekutif dalam dunia bisnis.

Hal ini disebabkan karena data pada tingkat ini dianggap

sudah cukup representative dan ringkas. Akan tetapi tetap dapat

merepresentasikan keadaan data secara keseluruhan. Hal ini tentu

saja sangat memudahkan kalangan pimpinan atau eksekutif karena

tidak perlu lagi membaca dan melakukan analisis data untuk waktu

yang cukup lama.

2.1.5.4 Keuntungan Data Warehouse

Menurut Connolly dan Begg (2005, p1152), keuntungan data

warehouse adalah:

1. Potensial ROI (Returns on Investment) yang tinggi. Organisasi

harus menjalankan jumlah yang besar dari sumber untuk menjamin

kesuksesan implementasi dari data warehouse dan biaya yang

sangat besar bagi solusi technical support yang tersedia.

Penyelidikan dari International Data Corporation (IDC) pada

tahun 1996 menjalankan rata-rata ROI dalam 2 tahun dengan data

warehousing mencapai 401%, diatas 90% perusahaan yang

disurvei mencapai diatas 160% ROI, dan seperempatnya lebih dari

600% ROI.

2. Competitive Advantage. ROI yang besar bagi perusahaan-

perusahaan diperoleh dari kesuksesan data warehouse merupakan

fakta bahwa competitive advantage yang besar menyertai teknologi

ini. Competitive advantage diperoleh dengan menyediakan akses

pembuatan keputusan ke data yang dapat mengungkapkan

ketidaksediaan, ketidakpahaman, dan ketidakterbukaan informasi

sebelumnya, sebagai contoh customer, trend, dan permintaan.

3. Meningkatkan produktivitas pembuatan keputusan perusahaan.

Data warehouse meningkatkan produktivitas pembuatan keputusan

perusahaan dengan menciptakan integrasi database yang

konsisten, subject-oriented, data historikal.

2.1.5.5 Komponen Data Warehouse

Komponen data warehouse terdiri atas:

1. Operational Data Source

Sumber data untuk data warehouse didapat dari main frame

operasional data, data tiap departemen, data pribadi, dan dari

sistem eksternal seperti internet.

2. Operational Data Store

Merupakan tempat menyimpan current data dan data

operasional dan terintegrasi untuk dianalisa.

3. Load Manager (Frontend Component)

Melakukan semua operasi yang berhubungan dengan

pengekstrakan dan pemuatan data ke data warehouse.

4. Warehouse Manager

Warehouse manager berupa:

• Melakukan analisa data untuk menjaga konsistensi data.

• Melakukan transformasi dan penggabungan sumber data

dari penyimpanan sementara ke dalam tabel-tabel data

warehouse

• Menciptakan index dan view pada base tables

• Melakukan denormalisasai (jika diperlukan)

• Melakukan agregasi (jika diperlukan)

• Melakukan back-up dan archive / back-up data

5. Query Manager

Query manager melakukan semua operasi yang

berhubungan dengan management user queries. Kemampuan ini

dibangun dengan menggunakan vendor end-user data access tools,

data warehouse monitoring tools, falisilitas basis data, dan custom

build-in program. Kompleksitas queries manager ditentukan oleh

fasilitas yang disediakan oleh end-user access tools dan basis data.

Operasi yang dilakukan komponen ini berupa pengarahan query

pada tabel-tabel yang tepat dan penjadwalan eksekusi query.

6. Detailed Data

Komponen ini menyimpan semua data detil dalam skema

basis data. Pada umumnya beberapa data tidak disimpan secara

fisik tetapi dapat dilakukan dengan cara agregasi. Secara periodik

data detil ditambahkan ke data warehouse untuk mendukung

agregasi data.

7. Lightly and Highly Summarized Data

Komponen ini menyimpan semua data yang diringkas oleh

warehouse manager. Data perlu diringkas dengan tujuan untuk

mempercepat performa query. Rangkuman data turut diperlukan

seiring dengan adanya data yang baru yang masuk ke dalam data

warehouse.

8. Archive / Back-up Data

Komponen ini menyimpan data detil dan ringkasan data

dengan tujuan untuk menyimpan dan back-up data. Walaupun

ringkasan yang diperoleh dari data mendetil, ringkasan perlu di

back-up juga apabila data tersebut disimpan melampaui periode

penyimpanan data detil. Data kemudian digunakan ke media

penyimpanan seperti magnetic tape atau optical disc.

9. Metadata

Komponen ini menyimpan semua definisi metadata

(informasi mengenai data) yang digunakan dalam proses dalam

data warehouse. Metadata digunakan untuk berbagai tujuan,

antara lain:

• Proses extracting dan loading, metadata digunakan untuk

menentukan sumber data dalam warehouse.

• Proses manajemen warehouse, metadata digunakan untuk

menghasilkan tabel ringkasan.

• Sebagai bagian dari proses manajemen query, metadata

digunakan untuk mengarahkan sebuah query pada sumber

data yang tepat.

10. End-user Access Tools

Tujuan utama dari data warehouse adalah menyediakan

informasi bagi pengguna untuk pembuatan keputusan yang

strategis dalam berbisnis. Para pengguna berinteraksi dengan data

warehouse menggunakan end-user access tools. Berdasarkan

kegunaan data warehouse, terdapat lima kategori end-user access

tools, yaitu:

• Reporting and Query Tools

Reporting tools meliputi production reporting tools dan

report writers.

Production reporting tools digunakan untuk menghasilkan

laporan operasional secara berkala.

Query Tools untuk relasional data warehouse dirancang

untuk menerima SQL, dan proses query data yang

tersimpan di warehouse.

• Application Development Tools

Application Development Tools menggunakan graphical

data access tools yang dirancang khusus untuk lingkungan

client-server. Beberapa aplikasi tersebut diintegrasikan

dengan OLAP tools, dan dapat mengakses semua sistem

basis data utama.

• Executive Information System (EIS) Tools

EIS sering dikenal sebagai “everyone’s information system”

(sistem informasi setiap orang). Awalnya dikembangkan

untuk mendukung pembuatan kebutuhan top-level yang

strategis. Akan tetapi, kemudian meluas untuk mendukung

semua tingkat manajemen. EIS tools pada awalnya

berhubungan dengan mainframes yang memungkinkan para

pengguna untuk membangun aplikasi pendukung keputusan

yang bersifat grafik untuk menyediakan sebuah overview

mengenai data perusahaan dan akses pada sumber data

eksternal. Kini, EIS banyak dilengkapi dengan fasilitas

query dan menyediakan custom-build applications untuk

area bisnis seperti penjualan, pemasaran dan keuangan.

• Online Analytical Processing (OLAP) Tools

OLAP tools didasarkan pada konsep basis data yang

bersifat multi-dimensional dan memperbolehkan pengguna

untuk menganalisis data dari sudut pandang yang kompleks

dan multi-dimensi. Alat Bantu ini mengasumsikan bahwa

data diatur dengan model multi-dimensi yang khusus

(MDDB) atau oleh sebuah relational basis data yang

dirancang untuk memungkinkan query multi dimensi.

• Data Mining Tools

Data mining adalah proses menemukan korelasi, pola dan

tren yang baru, yaitu dengan melakukan penggalian

sejumlah data menggunakan teknik statistik, matematis,

dan artificial intelligent (AI). Data mining memiliki potensi

untuk menggatikan kemampuan OLAP tools.

2.1.5.6 OLTP (Online Transaction Processing)

Menurut Connoly dan Begg (2005, p1153), Online Transaction

Processing (OLTP) is the systems that have been designed to handle high

transaction throughput, with transactions typically making small changes

to the organization’s operational data, that is, data that the organization

requires to handle its day-to-day operations ”, yang berarti OLTP adalah

suatu sistem yang telah dirancang untuk menangani jumlah hasil

transaksi yang tinggi, dengan transaksi yang pada umumnya membuat

perubahan yang kecil bagi data operasional organisasi. Oleh karena itu,

data organisasi memerlukan penanganan operasinya setiap hari.

Data pada database operasional bersifat volatile, dirancang untuk

membuat perubahan baru dan termutakhir terhadap data didalamnya,

menjaga integrasi data dan melaksanakan transaksi data secepat mungkin.

Pemakai dapat melihat informasi, mungkin memanipulasi informasi

tersebut pada layar komputer, tetapi pemakai tidak dapat merubah isi data

dari data yang ada pada database analisis. Sedangkan database analisis

dirancang untuk sejumlah besar data yang bersifat read only serta

menyediakan informasi yang digunakan untuk membuat keputusan. Pada

pemerosesan database analisis, tidak terdapat pemerosesan data secara

satuan record setiap kali terjadi perubahan isi record. Perubahan pada

database analisis dilakukan sesuai jadwal yang sudah ditentukan. Karena

organisasi menggunakan banyak aplikasi piranti lunak dan banyak

database, maka data warehouse digunakan untuk mengumpulkan dan

mengatur data yang diperoleh dari aplikasi-aplikasi bertahun-tahun dalam

suatu tempat.

2.1.5.6.1 Perbandingan antara OLTP dan Data Warehouse

Tabel 2.2 Perbandingan antara OLTP dengan Data Warehouse

(Connoly dan Begg, 2005, p1153)

3.

2.1.5.7 OLAP (Online Analytical Processing)

Menurut Connoly dan Begg (2005,p1205), OLAP adalah sintesis

dinamis, analisis dan konsolidasi dari sekumpulan besar data

multidimensi. OLAP merupakan proses departmental untuk lingkungan

data mart. OLAP mendeskripsikan sebuah teknologi yang menggunakan

view multi-dimensi dari sekumpulan data untuk menyediakan akses yang

TABEL OLTP DATA WAREHOUSE

Tujuan Menjalankan operasi

sehari-hari

Mengambil dan menganalisa

informasi

Management database RDBMS RDBMS

Metode Pemodelan Data Normalisasi Skema Bintang

Akses SQL SQL ditambah dengan

kemampuan analisa data

Kegunaan data Digunakan untuk

menjalankan kegiatan

bisnis harian

Digunakan untuk

menganalisa dan menyiasati

strategi bisnis

cepat ke informasi strategis untuk analisis lebih lanjut. Aplikasi OLAP

tergantung dengan data warehouse dan system OLTP untuk merefresh

source level data.

OLAP adalah teknologi yang memperbolehkan para user untuk

menganalisa basis data yang besar untuk mendapatkan sistem informasi

yang lebih spesifik. Basis data untuk sistem OLAP disusun terstruktur

agar lebih efisien dalam penyimpanan data statis. Karena penyimpanan

OLAP adalah multidimensi, biasa disebut cube, yang berlawanan dengan

tabel. Yang membuat OLAP unik adalah kemampuannya untuk

menyimpan kumpulan data secara hirarki. Dimensi-dimensi memberikan

informasi secara kontekstual dalam bentuk bilangan atau perhitungan yang

lebih teliti.

2.1.5.6.1 Perbandingan OLAP dan OLTP

Tabel 2.3 Perbandingan OLAP dan OLTP

(Connoly dan Begg , 2005,p1153 )

OLAP OLTP

Digunakan untuk mendukung kegiatan

analisis

Digunakan untuk mendukung kegiatan

transaksi sehari-hari

Menggunakan view multi dimensi Menggunakan view single

Mendukung keputusan untuk masa

depan

Mendukung keputusan per hari

Bergantung pada data yang tesimpan

pada OLTP

Tidak bergantung pada OLAP

Melayani manajerial user Melayani operasional user

Operasi query-nya lebih rumit, adhoc

dan tidak melibatkan operasi data

update

Operasi query-nya sederhana dan

berulang-ulang

Memakai data yang terangkum dalam

data cube

Memakai data sehari-hari

2.1.5.6.2 Perbandingan OLAP dan Data Warehouse

Tabel 2.4 Perbandingan OLAP dan Data Warehouse

(Connoly dan Begg,2005,p1049)

OLAP DATA WAREHOUSE

Merupakan end-user access tools dari data

sederhana

Merupakan basis data untuk menyimpan

data syarat dan menyediakan data cube

yang akan digunakan untuk OLAP

Mendukung manajerial user dan analytical

user

Mendukung manajerial user

Bergantung pada data yang tersimpan pada

data warehouse

Tidak bergantung pada OLAP dalam

penyediaan datanya

Menggunakan teknologi data warehouse

dalam penggunaannya

Menyediakan teknologi yang digunakan

untuk melakukan OLAP

2.1.6. Metodologi Perancangan Data Warehouse

Menurut Connolly dan Begg (2005,p1187-1193), metodologi yang

dikemukakan oleh Kimball dalam membangun data warehouse ada 9 tahapan,

yang dikenal dengan Nine-step Methodology. Sembilan tahap tersebut adalah :

1. Memilih Proses ( choosing the process )

Proses (fungsi) merujuk pada subjek masalah dari data mart tertentu.

Datamart yang akan dibangun harus sesuai anggaran dan dapat menjawab

masalah-masalah yang penting.

2. Memilih Grain ( choosing the grain )

Memilih grain berarti menentukan hal yang sebenarnya dihadirkan

oleh tabel fakta. Setelah menentukan grain-grain tabel fakta, dimensi-

dimensi untuk setiap fakta dapat diidentifikasi.

3. Mengidentifikasi dan Membuat Dimensi yang Sesuai ( Identifying and

Comforming the Dimentions )

Mengidentifikasi dimensi disertai deskripsi detail yang secukupnya.

Ketika table dimensi berada pada dua atau lebih data mart maka tabel

dimensi tersebut harus mempunyai dimensi yang sama atau salah satu

merupakan subset dari yang lainnya. Jika suatu tabel dimensi digunakan

oleh lebih dari satu data mart, maka dimensinya harus disesuaikan.

4. Memilih Fakta ( Choosing the Facts )

Memilih fakta yang akan digunakan dalam data mart. Semua fakta

harus ditampilkan pada tingkat yang diterapkan oleh grain dan fakta juga

harus numerik dan aditif.

5. Menyimpan pre- kalkulasi salam tabel Fakta ( Storing pre-calculation in

the Fact Table )

Ketika fakta telah dipilih, maka setiap fakta tersebut harus diuji

apakah ada fakta yang dapat menggunakan pre-kalkulasi, setelah itu

lakukan penyimpanan pada tabel fakta.

6. Melengkapi Tabel Dimensi ( Rounding Out the Dimension Table )

Menambahkan sebanyak mungkin deskripsi teks pada tabel dimensi.

Deskripsi tersebut harus intuitif dan dapat dimengerti oleh user.

7. Memilih Durasi Dari Database ( Choosing the Duration of the Database )

Menentukan batas waktu dari umur data yang diambil dan akan

dipindahkan ke dalam tabel fakta. Misalnya, data perusahaan dua tahun

lalu atau lebih diambil dan dimasukkan ke dalam tabel fakta.

8. Melacak Perubahan Dari Dimensi Secara Perlahan ( Tracking Slowly

Changing Dimensions )

Perubahan dimensi yang lambat menjadi sebuah masalah ada tiga tipe

dasar dari perubahan dimensi yang lambat, yakni :

a. Perubahan atribut dimensi yang ditulis ulang (overwrite).

b. Perubahan atribut dimensi yang mengakibatkan pembuatan suatu

record dimensi baru.

c. Perubahan atribut dimensi yang mengakibatkan sebuah atribut

alternative dibuat, sehingga kedua atribut tersebut yakni atribut

yang lama dan yang baru dapat diakses secara bersamaan dalam

sebuah dimensi yang sama.

9. Memutuskan Prioritas dan cara Query ( Deciding the Query Priorities and

the Query Modes)

Mempertimbangkan pengaruh dari perancangan fisikal yang akan

mempengaruhi persepsi user terhadap datamart. Selain itu, perancangan

fisikal ini akan mempengaruhi masalah administrasi, backup, kinerja

pengideksan dan keamanan.

2.1.7. Konsep Pemodelan Data Warehouse

Menurut Connoly dan Begg (2005, p1187), merancang data warehouse

merupakan suatu pekerjaan yang sangat kompleks. Untuk memulai sesuatu

proyek data warehouse mula-mula perlu dilakukan pengumpulan analisis

kebutuhan pengguna, yang bisa dilakukan dengan cara melakukan wawancara

terhadap anggota yang sesuai, contohnya pengguna dibidang pemasaran,

keuangan, penjualan, operasional, dan manajemen untuk mengidentifikasi satu set

kebutuhan yang terprioritaskan bagi perusahaan yang harus dipenuhi oleh data

warehouse. Hasil wawancara menyediakan informasi yang penting bagi top-down

view (kebutuhan pengguna ) dan bottom-up view (dimana sumber data tersedia)

dari data warehouse. Dengan dua pandangan diatas proses merancang data

warehouse sudah dapat dimulai.

Salah satu komponen basis data dalam data warehouse dideskripsikan

dengan menggunakan permodelan dimensionalitas (dimensionality modelling),

yaitu suatu teknik desain secara logis yang bertujuan untuk menyajikan data

dalam suatu bentuk standar dan intuitif yang memungkinkan akses dengan

performansi tinggi. Konsep permodelan dimensionalitas menggunakan konsep

dari permodelan entity-relationship (ER) dengan beberapa pembatasan penting.

Setiap model dimensionalitas terdiri dari satu tabel dengan satu composite

primary key (PK) yang dikenal sebagai tabel fakta (fact tabel), serta satu lagi tabel

yang lebih kecil yang dikenal sebagai tabel dimensi (dimension tabel).

Setiap tabel dimensi memiliki satu primary key yang berkorespondensi

dengan satu komponen dari composite key dalam tabel fakta. Dengan kata lain,

primary key dari tabel fakta terdiri dari dua atau lebih foreign key. Karakteristik

yang memiliki bentuk seperti bintang ini dikenal sebagai star schema atau star

join atau skema bintang.

2.1.7.1 Skema Bintang (Star Schema)

Menurut Connolly (2005, p1183), skema bintang adalah struktur

logikal yang mempunyai sebuah tabel fakta yang berisi data fakta di

tengah dan dikelilingi oleh tabel-tabel dimensi yang berisi data referensi

atau keterangan yang biasanya dapat denormalisasi.

Gambar 2.10 Star Schema

(Sumber : Connolly, 2005, p1184)

2.1.7.1.1 Tabel Facta (Fact Table)

Menurut Connolly dan Begg (2005, p1183), “Every

dimensional model (DM) is composed of one table with a

composite primary key, called the fact table”, yang berarti tabel

fakta adalah suatu tabel pada Dimensional Model (DM) yang

isinya composite primary key (PK). Jadi PK pada tabel fakta

merupakan beberapa foreign key.

2.1.7.1.2 Tabel Dimensi (Dimenstion Table)

Menurut Connolly dan Begg (2005, p1183), “Dimensional

table is a set of smaller tables called dimension tables”, yang

berarti tabel dimensi adalah sekumpulan tabel-tabel yang lebih

kecil dari tabel fakta pada dimensional model (DM). Setiap

tabel dimensi mempunyai non-composite Primary Key.

2.1.7.1.3 Surrogate key

Menurut http 1, A surrogate key is an artificially produced

value, most often a system-managed, incrementing counter

whose values can range from 1 to n, where n represents a

table's maximum number of rows. In SQL Server, create a

surrogate key by assigning an identity property to a column

that has a number data type. A natural key is a naturally

occurring descriptor of the data and one of a table's attributes

that has no duplicate values. When use a natural key as a table's

primary key, each of the table's rows is uniquely identified.

Artinya, sebuah nilai yang dihasilkan secara buatan, sistem

yang paling sering dikelola, penambahan nilai-nilai yang dapat

berkisar dari 1 hingga n, dimana n merupakan jumlah angka

maksimum dari baris yang ada pada tabel. Dalam SQL Server,

membuat surrogate key dengan menetapkan identitas pada

kolom yang memiliki sejumlah tipe data. Kunci yang secara

alami menjadi deskripsi dari data dan salah satu atribut dari

tabel tidak bernilai ganda. Ketika menggunakan kunci tersebut

sebagai sebuah primary key dari tabel, masing-masing baris

pada tabel secara unik teridentifikasi.

2.1.7.2 Keuntungan Skema Bintang

Skema bintang memiliki keuntungan yang tidak didapat oleh skema

relasional biasa. Keuntungan skema bintang, antara lain:

• Respon data yang lebih cepat dihasilkan dari perancangan

database.

• Kemudahan dalam mengembangkan atau memodifikasi data yang

terus berubah.

• End user dapat menyesuaikan cara berpikir dan menggunakan

data, konsep ini dikenal juga dengan istilah pararel dalam

perancangan database.

• Menyederhanakan pemahaman dan penelusuran metadata bagi

pemakai dan pengembang.

2.1.8 Arsitektur Data Warehouse

2.1.8.1 Centralized Data Warehouse

Centralized data warehouse ini merupakan database fisikal tunggal

yang memuat semua data untuk area fungsional yang khusus, departemen,

divisi, atau perusahaan. Data warehouse ini digunakan ketika terdapat

kebutuhan akan data informasional dan terdapat banyak end-user yang

sudah terhubung ke komputer pusat atau jaringan.

Bentuknya menyerupai functional data warehouse, akan tetapi

sumber datanya lebih dahulu dikumpulkan atau diintegrasikan pada suatu

tempat terpusat, baru kemudian data tersebut dibagi berdasarkan fungsi-

fungsi yang dibutuhkan oleh perusahaan. Bentuk data warehouse terpusat

ini sering digunakan oleh perusahaan-perusahaan yang belum mempunyai

jaringan eksternal.

Keuntungan bentuk centralized data warehouse ini adalah data

benar-benar terpadu karena konsistensi yang tinggi. Namun demikian

membutuhkan waktu yang lama dan biaya yang mahal dalam membentuk

data warehouse seperti ini.

Gambar 2.11 Centralized Data Warehouse

2.1.9 ETL (Extract,Transform,Loading)

Menurut Silvers(2008,p150) ETL (Extract, Transform, Load) adalah

proses-proses dalam data warehouse yang meliputi:

• Mengekstrak data dari sumber-sumber eksternal.

• Mentransformasikan data ke bentuk yang sesuai dengan keperluan bisnis.

• Memasukkan data ke target akhir, yaitu data warehouse.

ETL merupakan proses yang sangat penting, dengan ETL data dapat

dimasukkan ke dalam data warehouse. ETL juga dapat digunakan untuk

mengintegrasikan data dengan sistem yang sudah ada sebelumnya.

Tujuan ETL adalah mengumpulkan, menyaring, mengolah, dan

menggabungkan data yang relevan dari berbagai sumber untuk disimpan ke dalam

data warehouse. Hasil dari proses ETL adalah dihasilkannya data yang memenuhi

kriteria data warehouse seperti data historis, terpadu, terangkum, statis, dan

memiliki struktur yang dirancang untuk keperluan proses analisis.

Extract

Langkah pertama pada proses ETL adalah mengekstrak data dari

sumber-sumber data. Kebanyakan proyek data warehouse

menggabungkan data dari sumber-sumber yang berbeda. Pada hakekatnya,

proses ekstraksi adalah proses penguraian, pembersihan dari data yang

diekstrak untuk mendapatkan struktur atau pola data yang diharapkan.

Transform

Tahapan transfomasi menggunakan serangkaian aturan atau fungsi

untuk mengekstrak data dari sumber dan selanjutnya akan dimasukkan ke

dalam data warehouse. Berikut adalah hal- hal yang dapat dilakukan

dalam tahap transformasi :

o Hanya memilih kolom tertentu saja untuk dimasukkan ke dalam

data warehouse.

o Menterjemahkan nilai-nilai yang berupa kode (contohnya apabila

database sumber menyimpan nilai 1 untuk laki- laki dan nilai 2

untuk perempuan, tetapi data warehouse yang telah ada

menyimpan M untuk laki-laki dan F untuk perempuan, ini disebut

dengan automated data cleansing, tidak ada pembersihan secara

manual yang ditunjukkan selama proses ETL.

o Mengkodekan nilai-nilai ke dalam bentuk bebas (contohnya

memetakan “Male”, “1” dan “Mr” ke dalam M).

o Melakukan perhitungan nilai-nilai baru (contohnya sale_amount =

qty * unit_price).

o Menggabungkan data secara bersama-sama dari berbagai sumber.

o Membuat ringkasan dari sekumpulan baris data (contohnya total

penjualan untuk setiap toko atau setiap bagian).

Loading

Fase load merupakan tahapan yang berfungsi untuk memasukkan

data ke dalam target akhir, yang biasanya ke dalam suatu data warehouse.

Jangka waktu proses ini tergantung pada kebutuhan organisasi. Beberapa

data warehouse dapat setiap minggu menulis keseluruhan informasi yang

ada secara kumulatif, data diubah, sementara data warehouse yang lain

(atau bagian lain dari data warehouse yang sama) dapat menambahkan

data baru dalam suatu bentuk historikal, contohnya setiap jam. Waktu dan

jangkauan untuk mengganti atau menambah data tergantung dari

perancangan data warehouse pada waktu menganalisis keperluan

informasi.

Gambar 2.12 Extract, Transform, Load (ETL)

(Sumber : Silvers, 2008, p152)

2.1.10 Metadata

Menurut Paulraj Ponniah(2001,p36), metadata dalam sebuah

datawarehouse di bagi ke dalam 3 kategori utama :

• Operational Metadata

Data untuk data warehouse berasal dari beberapa sistem operasional

dari perusahaan. Sumber sistem ini mengandung struktur data yang

berbeda. Elemen data yang dipilih untuk data warehouse mempunyai

bermacam-macam field lengths dan tipe data. Dalam memilih data dari

sumber sistem untuk data warehouse, record harus dipisahkan,

menggabungkan bagian-bagian records dari sumber file yang berbeda dan

membuat kesepakatan dengan skema pengkodingan ganda dan field

lengths. Ketika informasi dikirim kepada end user, harus dapat

menghubungkan kembali ke kumpulan sumber data yang asli. Operasional

metadata mengandung semua informasi mengenai operasional sumber

data.

• Extraction and Transformation Metadata

Extraction dan Transformation Metadata mengandung data mengenai

ekstraksi data dari sumber sistem, yakni ekstraksi frekuensi, ekstraksi

metode dan aturan-aturan bisnis untuk ekstraksi data. Juga, kategori dari

metadata ini mengandung informasi tentang semua transformasi data yang

mengambil tempat dalam data staging area.

• End-User Metadata

End-User Metadata merupakan peta navigasi dari data warehouse.

Hal ini memungkinkan end-user untuk menemukan informasi dari data

warehouse. End-user metadata mengijinkan end-user untuk

menggunakan terminologi bisnis milik mereka sendiri dan mencari

informasi dalam cara itu dimana mereka secara normal berpikir mengenai

bisnis.

2.1.11 Fact Finding

Menurut Connolly dan Begg (2005, p317- 321), fact finding adalah proses

formal yang menggunakan teknik-teknik seperti wawancara dan kuesioner untuk

mengumpulkan fakta-fakta mengenai sistem, persyaratan dan preferensi. Metode yang

digunakan fact finding adalah :

1. Wawancara

Wawancara adalah yang paling sering digunakan, dan biasanya

paling berguna, teknik pencarian fakta. Kita dapat wawancara untuk

mengumpulkan informasi dari individu melalui tatap muka. Ada beberapa

tujuan dapat menggunakan wawancara, seperti mencari tahu fakta,

memverifikasi fakta, mengklarifikasi fakta, menghasilkan antusiasme,

mendapatkan pengguna akhir yang terlibat, mengidentifikasi kebutuhan,

dan mengumpulkan ide - ide dan pendapat. Akan tetapi, dengan

menggunakan teknik wawancara membutuhkan keterampilan komunikasi

yang baik untuk berurusan secara efektif dengan orang - orang yang

memiliki nilai yang berbeda, prioritas, opini, motivasi, dan kepribadian.

seperti fakta lain teknik wawancara tidak selalu merupakan metode terbaik

untuk semua situasi.

Terdapat dua macam tipe interview: tidak terstruktur dan

terstruktur.

Wawancara tidak terstruktur dilakukan hanya dengan tujuan

umum dalam pikiran dan dengan sedikit, jika ada, pertanyaan - pertanyaan

spesifik. Pewawancara menghitung pada orang yang diwawancara untuk

menyediakan kerangka kerja dan arah untuk wawancara. Wawancara jenis

ini sering kehilangan fokus, karena alasan ini, sering kali tidak berfungsi

dengan baik untuk analisis dan desain database.

Wawancara terstruktur, pewawancara memiliki serangkaian

pertanyaan khusus untuk meminta diwawancarai. tergantung pada respon

orang yang diwawancara, pewawancara akan langsung menambah

pertanyaan-pertanyaan untuk mendapatkan klarifikasi atau ekspansi.

Untuk memastikan kesuksesan wawancara meliputi memilih

individu yang sesuai untuk wawancara, mempersiapkan secara ekstensif

untuk wawancara, dan melakukan wawancara yang efisien dan efektif.

Tabel 2.5 Keuntungan dan Kelemahan Menggunakan Wawancara sebagai Teknik Fact

Finding (Connolly dan Begg, 2005, p318)

2. Mengamati perusahaan beroperasi

Pengamatan adalah salah satu yang paling efektif teknik pencarian

fakta untuk memahami sebuah sistem. Dengan teknik ini, mungkin baik

untuk berpartisipasi , atau menonton, orang yang melakukan kegiatan

untuk belajar tentang sistem. Teknik ini terutama bermanfaat bila validitas

data yang dikumpulkan melalui metode lain yang terkait atau ketika

kompleksitas aspek-aspek tertentu dari sistem mencegah penjelasan yang

jelas oleh pengguna akhir, seperti dengan fakta lain teknik, pengamatan

yang sukses membutuhkan persiapan. Untuk memastikan bahwa

pengamatan berhasil, sangat penting untuk mengetahui sebanyak mungkin

tentang individu dan kegiatan yang harus diperhatikan mungkin.

Tabel 2.6 Keuntungan dan Kelemahan Menggunakan Observasi sebagai Teknik Fact

Finding

(Sumber : Connolly, 2005, p319)

2.2. Teori-teori khusus

2.2.1. Sistem Penjualan

Menurut Anita S. Hollander et al. (2000, p230), penjualan adalah kumpulan

kejadian yang secara kolektif melayani untuk menarik pelanggan, membantu

pelanggan untuk memilih barang dan layanan, mengantar barang dan layanan

yang diminta, dan mengumpulkan pembayaran untuk barang dan layanan.

2.2.2. Sistem Pembelian

Menurut Mulyadi (2001, p301), sistem pembelian digunakan dalam

perusahaan untuk pengadaan barang yang diperlukan oleh perusahaan. Fungsi

pembelian pada sistem pembelian bertanggung jawab untuk memperoleh

informasi mengenai harga barang, menentukan pemasok yang dipilih dalam

pengadaan barang, dan mengeluarkan order pembelian kepada pemasok yang

dipilih.

2.2.3. Sistem Pemasaran

Menurut Hendro, & Widhianto, C.W. (2006, p419), Pemasaran adalah

proses kegiatan dalam perusahaan dan manajerial dimana individu, kelompok atau

perusahaan mendapatkan apa yang mereka butuhkan atau harapkan melalui

penciptaan, penawaran dan pertukaran segala sesuatu yang bernilai dengan orang

lain atau kelompok yang lain.

bab 2 fix - library.binus.ac.idlibrary.binus.ac.id/ecolls/ethesisdoc/bab2/2010-1-00711-si-bab...

Documents