bab 2 fix - library.binus.ac.idlibrary.binus.ac.id/ecolls/ethesisdoc/bab2/2010-1-00711-si-bab...
TRANSCRIPT
BAB 2
LANDASAN TEORI
2.1. Teori-Teori Umum
2.1.1. Pengertian Data
Menurut O’Brien (2005,p38)data adalah fakta atau observasi mentah yang
biasanya mengenai transaksi bisnis.
2.1.2. Pengertian Informasi
Menurut McLeod and Schell (2001,p12), informasi merupakan data yang
telah diproses atau data yang memiliki makna.
2.1.3. Pengertian Database
Menurut Connoly dan Begg (2005,p15), database adalah kumpulan data-data
yang saling berhubungan satu sama lain yang digunakan secara bersama-sama dan
dirancang untuk memenuhi kebutuhan informasi perusahaan atau organisasi.
2.1.4. Pemodelan Entity Relationship
Menurut Connoly dan Begg (2005,p342), pemodelan ER adalah pendekatan
dari atas ke bawah untuk merancang database yang dimulai dengan
mengidentifikasi data yang penting yang dikenal dengan sebutan entitas dan
hubungan antara data harus diperlihatkan dalam model ini. Konsep dasar dari
pemodelan ER antara lain:
a) Entitas (Entity)
Menurut Connoly dan Begg (2005,p343), entity type adalah sekumpulan
objek dengan properti yang sama, dimana diidentifikasikan oleh perusahaan
karena mempunyai keadaan bebas. Menurut Connoly dan Begg (2005,
p333), entity occurence adalah objek yang didefinisikan secara unik dari
entity type. Entity type digambarkan dalam bentuk bujur sangkar dengan
diberi nama entitas, yang umumnya adalah kata benda tunggal, dapat dilihat
pada gambar 2.1
Gambar 2.1 Diagram dari Entity Type Branch dan Staff
(Sumber : Connoly dan Begg, 2005, p345)
b) Hubungan (Relationship)
Menurut Connoly dan Begg (2005, p346), relationship type adalah
sekumpulan asosiasi berarti antara entity types.
Setiap relationship type digambarkan dengan garis yang menghubungkan
entity type, dan diberi nama hubungannya seperti pada gambar 2.2 Pada
umumnya, hubungannya menggunakan kata kerja atau frase pendek yang
mengandung kata kerja. Jika memungkinkan, nama hubungannya harus
bersifat unik. Secara umum, nama hubungan hanya mempunyai arti untuk
satu arah saja. Contohnya : pada gambar dibawah ini menyatakan bahwa
Branch memilliki Staff.
Gambar 2.2 Diagram dari Relationship Type Branch mempunyai Staff
(Sumber : Connoly dan Begg ,2005, p347)
c) Atribut (Attribute)
Menurut Connoly dan Begg (2005, p350), atribut adalah properti dari
sebuah entitas atau relationship type. Contohnya, Staff memiliki atribut
StaffNo, nama, posisi, dan gaji.
d) Multiplicity
Menurut Connoly dan Begg (2005, p356), multiplicity adalah sejumlah
kemunculan yang mungkin ada dalam sebuah entitas yang berhubungan
dengan kemunculan tunggal dari entitas yang berhubungan dengannya.
Tiga tipe hubungan multiplicity adalah :
• 1:1 (One-to-One)
Contoh dari hubungan ini ádalah :
Gambar 2.3 Multiplicity hubungan satu ke satu dari staff yang mengatur Branch
(Sumber : Connoly dan Begg,2005, p358)
Artinya, seorang staff dapat mengatur nol atau satu cabang dan
masing-masing cabang di atur oleh satu staff.
• 1:* (One-to-Many)
Contoh dari hubungan ini adalah :
Gambar 2.4 Multiplicity hubungan satu ke banyak dari staff yang mengawasi property for
rent
(Sumber : Connoly dan Begg, 2005, p359)
Artinya, seorang staff dapat mengawasi nol atau lebih properti yang
akan disewa dan sebuah properti yang akan disewa diawasi oleh nol
atau satu staff.
• *:* (Many-to-Many)
Contoh dari hubungan ini adalah :
Gambar 2.5 Multiplicity hubungan banyak ke banyak dari newspaper yang
mengiklankan property for rent
(Sumber : Connoly dan Begg, 2005, p360)
Artinya, satu koran mengiklankan satu atau lebih properti yang akan
disewa dan satu properti yang akan disewa diiklankan oleh nol atau
lebih koran.
2.1.5. Konsep Data warehouse
2.1.5.1 Pengertian Data Warehouse
Menurut Inmon (2005,p29), data warehouse merupakan kumpulan
dari database yang memiliki sifat berorientasi subjek, terintegrasi, yang
dirancang untuk dapat mendukung pengambilan keputusan dalam
organisasi, dimana tiap datanya berhubungan dengan suatu kejadian yang
terjadi pada suatu waktu tertentu.
2.1.5.2 Karakteristik Data Warehouse
Menurut Inmon (2005,p29), sebuah data warehouse memiliki
karakteristik sebagai berikut :
1. Subject Oriented
Data warehouse bersifat subject oriented berarti bahwa
data warehouse bukan berorientasikan pada proses atau fungsi
aplikasi tertentu, melainkan pada subyek-subyek tertentu dalam
perusahaan, yang mana biasanya memiliki subyek-subyek yang
unik untuk tiap perusahaannya. Misalnya : untuk perusahaan
asuransi subyeknya adalah pelanggan, kebijakan, premi, dan
keluhan; dalam pabrik subyeknya adalah produk, pesanan, vendor,
tagihan material, bahan baku; dan sebagainya.
Gambar 2.6 Aspek Subject Oriented dari Data Warehouse
(Sumber : Inmon, 2005, p30)
2. Integrated
Karakteristik integrasi ini dapat dikatakan merupakan aspek
terpenting dari data warehouse. Integrasi disini dimaksudkan
bahwa data dalam data warehouse memiliki satu bentuk tunggal
fisikal yang sama dan konsisten walau berasal dari sumber yang
berbeda-beda. Termasuk juga konsistensi pada aplikasi yang
mengaksesnya, aturan pengentrian data, aturan penamaan atribut,
dan karakteristik fisikal data lainnya. Jadi pengkodean pada data
warehouse dilakukan secara konsisten tanpa terpengaruh pada
metode maupun sumber aplikasinya berjalan seperti
bagaimanapun.
Gambar 2.7 Integrasi Data Warehouse
(Sumber : Inmon, 2005, p31)
3. Time Variant
Variasi waktu disini diartikan bahwa data di dalam sebuah
data warehouse berhubungan dengan suatu titik atau point dalam
suatu periode waktu tertentu. Misalnya semester, kwartalan, tahun
fiskal, atau periode pembayaran. Sebagai contoh, data yang
menunjukkan penjualan produk yang terlaris per tahun, jumlah
pembelian per kwartal, dan sebagainya.
Tabel 2.1 Perbandingan time variant antara data opersional dan data warehouse
(Inmon, 2005, p32)
Data Operasional Data Warehouse
Mempunyai time horizon 60 - 90
hari
Mempunyai time horizon 5 - 10
tahun
Data atau record dapat di-update
Data atau record tidak dapat di-
update
Key structure dapat termasuk atau
tidak termasuk elemen waktu
Key structure termasuk elemen
waktu
4. Nonvolatile (Tidak dapat berubah)
Karakteristik data warehouse nonvolatile dapat diartikan
bahwa ketika data sudah disimpan ke dalam sebuah data
warehouse, data harus tidak boleh berubah atau tidak boleh ada
perubahan didalamnya.
Gambar 2.8 Aspek Non-Volatile dari Data Warehouse
(Sumber : Inmon, 2005, p32)
2.1.5.3 Struktur Data Warehouse
Data warehouse mempunyai struktur yang spesifik dan
mempunyai perbedaan dalam tingkatan ringkasan (summary) dan detail
data serta perbedaan dalam tingkatan umur data. Menurut
Inmon(2005,p33) terdapat beberapa level of detail yang berbeda dalam
dalam data warehouse, yaitu :
• Current detail data (data detail saat ini)
• Old detail data (data detail historis)
• Lightly summarized data (data ringkasan level menengah)
• Highly summarized data (data ringkasan level tinggi)
METADATA
OperationalTransformation
Old Detail
Current Detail
Lightly Summarized(Data Mart)
HighlySummarized
Gambar 2.9 Struktur Data Warehouse
(Sumber : Inmon, 2005, p34)
1. Current detailed data
Pada bagian ini current detail data disimpan dalam skema
database. Data ini tidak disimpan secara langsung, tetapi data ini
ditambahkan dalam warehouse untuk melengkapi data yang
terkumpul. Data ini menjadi berguna saat detil data terkumpul pada
tahap berikutnya.
2. Old detailed data
Old detailed data merupakan data detil dan ringkas yang
berguna untuk arsip dan back up. Meskipun ringkasan data atau
summary didapat dari current detailed data, tetapi masih
memungkinkan untuk menyimpan ringkasan data tersebut secara
langsung jika data berada diluar periode current detailed data.
Data disimpan dalam sebuah penyimpanan seperti magnetic tape
atau optical disk.
3. Lightly summarized data
Lightly summarized data merupakan data ringkasan atau
summary dari current detailed data. Pada tingkat ini, data hasil
ringkasan masih belum dapat digunakan dalam proses
pengambilan keputusan karena belum bersifat ‘total summary’ dan
menjadi bersifat rinci.
Lightly summarized data biasanya sering digunakan untuk
gambaran dari keadaan yang sedang berlangsung dan sudah
berlangsung.
4. Highly summarized data
Highly summarized data merupakan hasil proses summary
yang bersifat ‘totalitas’. Data pada highly summarized ini sangat
mudah diakses. Data pada tingkat inilah yang pada akhirnya
digunakan untuk mendukung pengambilan keputusan terutama
dikalangan eksekutif dalam dunia bisnis.
Hal ini disebabkan karena data pada tingkat ini dianggap
sudah cukup representative dan ringkas. Akan tetapi tetap dapat
merepresentasikan keadaan data secara keseluruhan. Hal ini tentu
saja sangat memudahkan kalangan pimpinan atau eksekutif karena
tidak perlu lagi membaca dan melakukan analisis data untuk waktu
yang cukup lama.
2.1.5.4 Keuntungan Data Warehouse
Menurut Connolly dan Begg (2005, p1152), keuntungan data
warehouse adalah:
1. Potensial ROI (Returns on Investment) yang tinggi. Organisasi
harus menjalankan jumlah yang besar dari sumber untuk menjamin
kesuksesan implementasi dari data warehouse dan biaya yang
sangat besar bagi solusi technical support yang tersedia.
Penyelidikan dari International Data Corporation (IDC) pada
tahun 1996 menjalankan rata-rata ROI dalam 2 tahun dengan data
warehousing mencapai 401%, diatas 90% perusahaan yang
disurvei mencapai diatas 160% ROI, dan seperempatnya lebih dari
600% ROI.
2. Competitive Advantage. ROI yang besar bagi perusahaan-
perusahaan diperoleh dari kesuksesan data warehouse merupakan
fakta bahwa competitive advantage yang besar menyertai teknologi
ini. Competitive advantage diperoleh dengan menyediakan akses
pembuatan keputusan ke data yang dapat mengungkapkan
ketidaksediaan, ketidakpahaman, dan ketidakterbukaan informasi
sebelumnya, sebagai contoh customer, trend, dan permintaan.
3. Meningkatkan produktivitas pembuatan keputusan perusahaan.
Data warehouse meningkatkan produktivitas pembuatan keputusan
perusahaan dengan menciptakan integrasi database yang
konsisten, subject-oriented, data historikal.
2.1.5.5 Komponen Data Warehouse
Komponen data warehouse terdiri atas:
1. Operational Data Source
Sumber data untuk data warehouse didapat dari main frame
operasional data, data tiap departemen, data pribadi, dan dari
sistem eksternal seperti internet.
2. Operational Data Store
Merupakan tempat menyimpan current data dan data
operasional dan terintegrasi untuk dianalisa.
3. Load Manager (Frontend Component)
Melakukan semua operasi yang berhubungan dengan
pengekstrakan dan pemuatan data ke data warehouse.
4. Warehouse Manager
Warehouse manager berupa:
• Melakukan analisa data untuk menjaga konsistensi data.
• Melakukan transformasi dan penggabungan sumber data
dari penyimpanan sementara ke dalam tabel-tabel data
warehouse
• Menciptakan index dan view pada base tables
• Melakukan denormalisasai (jika diperlukan)
• Melakukan agregasi (jika diperlukan)
• Melakukan back-up dan archive / back-up data
5. Query Manager
Query manager melakukan semua operasi yang
berhubungan dengan management user queries. Kemampuan ini
dibangun dengan menggunakan vendor end-user data access tools,
data warehouse monitoring tools, falisilitas basis data, dan custom
build-in program. Kompleksitas queries manager ditentukan oleh
fasilitas yang disediakan oleh end-user access tools dan basis data.
Operasi yang dilakukan komponen ini berupa pengarahan query
pada tabel-tabel yang tepat dan penjadwalan eksekusi query.
6. Detailed Data
Komponen ini menyimpan semua data detil dalam skema
basis data. Pada umumnya beberapa data tidak disimpan secara
fisik tetapi dapat dilakukan dengan cara agregasi. Secara periodik
data detil ditambahkan ke data warehouse untuk mendukung
agregasi data.
7. Lightly and Highly Summarized Data
Komponen ini menyimpan semua data yang diringkas oleh
warehouse manager. Data perlu diringkas dengan tujuan untuk
mempercepat performa query. Rangkuman data turut diperlukan
seiring dengan adanya data yang baru yang masuk ke dalam data
warehouse.
8. Archive / Back-up Data
Komponen ini menyimpan data detil dan ringkasan data
dengan tujuan untuk menyimpan dan back-up data. Walaupun
ringkasan yang diperoleh dari data mendetil, ringkasan perlu di
back-up juga apabila data tersebut disimpan melampaui periode
penyimpanan data detil. Data kemudian digunakan ke media
penyimpanan seperti magnetic tape atau optical disc.
9. Metadata
Komponen ini menyimpan semua definisi metadata
(informasi mengenai data) yang digunakan dalam proses dalam
data warehouse. Metadata digunakan untuk berbagai tujuan,
antara lain:
• Proses extracting dan loading, metadata digunakan untuk
menentukan sumber data dalam warehouse.
• Proses manajemen warehouse, metadata digunakan untuk
menghasilkan tabel ringkasan.
• Sebagai bagian dari proses manajemen query, metadata
digunakan untuk mengarahkan sebuah query pada sumber
data yang tepat.
10. End-user Access Tools
Tujuan utama dari data warehouse adalah menyediakan
informasi bagi pengguna untuk pembuatan keputusan yang
strategis dalam berbisnis. Para pengguna berinteraksi dengan data
warehouse menggunakan end-user access tools. Berdasarkan
kegunaan data warehouse, terdapat lima kategori end-user access
tools, yaitu:
• Reporting and Query Tools
Reporting tools meliputi production reporting tools dan
report writers.
Production reporting tools digunakan untuk menghasilkan
laporan operasional secara berkala.
Query Tools untuk relasional data warehouse dirancang
untuk menerima SQL, dan proses query data yang
tersimpan di warehouse.
• Application Development Tools
Application Development Tools menggunakan graphical
data access tools yang dirancang khusus untuk lingkungan
client-server. Beberapa aplikasi tersebut diintegrasikan
dengan OLAP tools, dan dapat mengakses semua sistem
basis data utama.
• Executive Information System (EIS) Tools
EIS sering dikenal sebagai “everyone’s information system”
(sistem informasi setiap orang). Awalnya dikembangkan
untuk mendukung pembuatan kebutuhan top-level yang
strategis. Akan tetapi, kemudian meluas untuk mendukung
semua tingkat manajemen. EIS tools pada awalnya
berhubungan dengan mainframes yang memungkinkan para
pengguna untuk membangun aplikasi pendukung keputusan
yang bersifat grafik untuk menyediakan sebuah overview
mengenai data perusahaan dan akses pada sumber data
eksternal. Kini, EIS banyak dilengkapi dengan fasilitas
query dan menyediakan custom-build applications untuk
area bisnis seperti penjualan, pemasaran dan keuangan.
• Online Analytical Processing (OLAP) Tools
OLAP tools didasarkan pada konsep basis data yang
bersifat multi-dimensional dan memperbolehkan pengguna
untuk menganalisis data dari sudut pandang yang kompleks
dan multi-dimensi. Alat Bantu ini mengasumsikan bahwa
data diatur dengan model multi-dimensi yang khusus
(MDDB) atau oleh sebuah relational basis data yang
dirancang untuk memungkinkan query multi dimensi.
• Data Mining Tools
Data mining adalah proses menemukan korelasi, pola dan
tren yang baru, yaitu dengan melakukan penggalian
sejumlah data menggunakan teknik statistik, matematis,
dan artificial intelligent (AI). Data mining memiliki potensi
untuk menggatikan kemampuan OLAP tools.
2.1.5.6 OLTP (Online Transaction Processing)
Menurut Connoly dan Begg (2005, p1153), Online Transaction
Processing (OLTP) is the systems that have been designed to handle high
transaction throughput, with transactions typically making small changes
to the organization’s operational data, that is, data that the organization
requires to handle its day-to-day operations ”, yang berarti OLTP adalah
suatu sistem yang telah dirancang untuk menangani jumlah hasil
transaksi yang tinggi, dengan transaksi yang pada umumnya membuat
perubahan yang kecil bagi data operasional organisasi. Oleh karena itu,
data organisasi memerlukan penanganan operasinya setiap hari.
Data pada database operasional bersifat volatile, dirancang untuk
membuat perubahan baru dan termutakhir terhadap data didalamnya,
menjaga integrasi data dan melaksanakan transaksi data secepat mungkin.
Pemakai dapat melihat informasi, mungkin memanipulasi informasi
tersebut pada layar komputer, tetapi pemakai tidak dapat merubah isi data
dari data yang ada pada database analisis. Sedangkan database analisis
dirancang untuk sejumlah besar data yang bersifat read only serta
menyediakan informasi yang digunakan untuk membuat keputusan. Pada
pemerosesan database analisis, tidak terdapat pemerosesan data secara
satuan record setiap kali terjadi perubahan isi record. Perubahan pada
database analisis dilakukan sesuai jadwal yang sudah ditentukan. Karena
organisasi menggunakan banyak aplikasi piranti lunak dan banyak
database, maka data warehouse digunakan untuk mengumpulkan dan
mengatur data yang diperoleh dari aplikasi-aplikasi bertahun-tahun dalam
suatu tempat.
2.1.5.6.1 Perbandingan antara OLTP dan Data Warehouse
Tabel 2.2 Perbandingan antara OLTP dengan Data Warehouse
(Connoly dan Begg, 2005, p1153)
3.
2.1.5.7 OLAP (Online Analytical Processing)
Menurut Connoly dan Begg (2005,p1205), OLAP adalah sintesis
dinamis, analisis dan konsolidasi dari sekumpulan besar data
multidimensi. OLAP merupakan proses departmental untuk lingkungan
data mart. OLAP mendeskripsikan sebuah teknologi yang menggunakan
view multi-dimensi dari sekumpulan data untuk menyediakan akses yang
TABEL OLTP DATA WAREHOUSE
Tujuan Menjalankan operasi
sehari-hari
Mengambil dan menganalisa
informasi
Management database RDBMS RDBMS
Metode Pemodelan Data Normalisasi Skema Bintang
Akses SQL SQL ditambah dengan
kemampuan analisa data
Kegunaan data Digunakan untuk
menjalankan kegiatan
bisnis harian
Digunakan untuk
menganalisa dan menyiasati
strategi bisnis
cepat ke informasi strategis untuk analisis lebih lanjut. Aplikasi OLAP
tergantung dengan data warehouse dan system OLTP untuk merefresh
source level data.
OLAP adalah teknologi yang memperbolehkan para user untuk
menganalisa basis data yang besar untuk mendapatkan sistem informasi
yang lebih spesifik. Basis data untuk sistem OLAP disusun terstruktur
agar lebih efisien dalam penyimpanan data statis. Karena penyimpanan
OLAP adalah multidimensi, biasa disebut cube, yang berlawanan dengan
tabel. Yang membuat OLAP unik adalah kemampuannya untuk
menyimpan kumpulan data secara hirarki. Dimensi-dimensi memberikan
informasi secara kontekstual dalam bentuk bilangan atau perhitungan yang
lebih teliti.
2.1.5.6.1 Perbandingan OLAP dan OLTP
Tabel 2.3 Perbandingan OLAP dan OLTP
(Connoly dan Begg , 2005,p1153 )
OLAP OLTP
Digunakan untuk mendukung kegiatan
analisis
Digunakan untuk mendukung kegiatan
transaksi sehari-hari
Menggunakan view multi dimensi Menggunakan view single
Mendukung keputusan untuk masa
depan
Mendukung keputusan per hari
Bergantung pada data yang tesimpan
pada OLTP
Tidak bergantung pada OLAP
Melayani manajerial user Melayani operasional user
Operasi query-nya lebih rumit, adhoc
dan tidak melibatkan operasi data
update
Operasi query-nya sederhana dan
berulang-ulang
Memakai data yang terangkum dalam
data cube
Memakai data sehari-hari
2.1.5.6.2 Perbandingan OLAP dan Data Warehouse
Tabel 2.4 Perbandingan OLAP dan Data Warehouse
(Connoly dan Begg,2005,p1049)
OLAP DATA WAREHOUSE
Merupakan end-user access tools dari data
sederhana
Merupakan basis data untuk menyimpan
data syarat dan menyediakan data cube
yang akan digunakan untuk OLAP
Mendukung manajerial user dan analytical
user
Mendukung manajerial user
Bergantung pada data yang tersimpan pada
data warehouse
Tidak bergantung pada OLAP dalam
penyediaan datanya
Menggunakan teknologi data warehouse
dalam penggunaannya
Menyediakan teknologi yang digunakan
untuk melakukan OLAP
2.1.6. Metodologi Perancangan Data Warehouse
Menurut Connolly dan Begg (2005,p1187-1193), metodologi yang
dikemukakan oleh Kimball dalam membangun data warehouse ada 9 tahapan,
yang dikenal dengan Nine-step Methodology. Sembilan tahap tersebut adalah :
1. Memilih Proses ( choosing the process )
Proses (fungsi) merujuk pada subjek masalah dari data mart tertentu.
Datamart yang akan dibangun harus sesuai anggaran dan dapat menjawab
masalah-masalah yang penting.
2. Memilih Grain ( choosing the grain )
Memilih grain berarti menentukan hal yang sebenarnya dihadirkan
oleh tabel fakta. Setelah menentukan grain-grain tabel fakta, dimensi-
dimensi untuk setiap fakta dapat diidentifikasi.
3. Mengidentifikasi dan Membuat Dimensi yang Sesuai ( Identifying and
Comforming the Dimentions )
Mengidentifikasi dimensi disertai deskripsi detail yang secukupnya.
Ketika table dimensi berada pada dua atau lebih data mart maka tabel
dimensi tersebut harus mempunyai dimensi yang sama atau salah satu
merupakan subset dari yang lainnya. Jika suatu tabel dimensi digunakan
oleh lebih dari satu data mart, maka dimensinya harus disesuaikan.
4. Memilih Fakta ( Choosing the Facts )
Memilih fakta yang akan digunakan dalam data mart. Semua fakta
harus ditampilkan pada tingkat yang diterapkan oleh grain dan fakta juga
harus numerik dan aditif.
5. Menyimpan pre- kalkulasi salam tabel Fakta ( Storing pre-calculation in
the Fact Table )
Ketika fakta telah dipilih, maka setiap fakta tersebut harus diuji
apakah ada fakta yang dapat menggunakan pre-kalkulasi, setelah itu
lakukan penyimpanan pada tabel fakta.
6. Melengkapi Tabel Dimensi ( Rounding Out the Dimension Table )
Menambahkan sebanyak mungkin deskripsi teks pada tabel dimensi.
Deskripsi tersebut harus intuitif dan dapat dimengerti oleh user.
7. Memilih Durasi Dari Database ( Choosing the Duration of the Database )
Menentukan batas waktu dari umur data yang diambil dan akan
dipindahkan ke dalam tabel fakta. Misalnya, data perusahaan dua tahun
lalu atau lebih diambil dan dimasukkan ke dalam tabel fakta.
8. Melacak Perubahan Dari Dimensi Secara Perlahan ( Tracking Slowly
Changing Dimensions )
Perubahan dimensi yang lambat menjadi sebuah masalah ada tiga tipe
dasar dari perubahan dimensi yang lambat, yakni :
a. Perubahan atribut dimensi yang ditulis ulang (overwrite).
b. Perubahan atribut dimensi yang mengakibatkan pembuatan suatu
record dimensi baru.
c. Perubahan atribut dimensi yang mengakibatkan sebuah atribut
alternative dibuat, sehingga kedua atribut tersebut yakni atribut
yang lama dan yang baru dapat diakses secara bersamaan dalam
sebuah dimensi yang sama.
9. Memutuskan Prioritas dan cara Query ( Deciding the Query Priorities and
the Query Modes)
Mempertimbangkan pengaruh dari perancangan fisikal yang akan
mempengaruhi persepsi user terhadap datamart. Selain itu, perancangan
fisikal ini akan mempengaruhi masalah administrasi, backup, kinerja
pengideksan dan keamanan.
2.1.7. Konsep Pemodelan Data Warehouse
Menurut Connoly dan Begg (2005, p1187), merancang data warehouse
merupakan suatu pekerjaan yang sangat kompleks. Untuk memulai sesuatu
proyek data warehouse mula-mula perlu dilakukan pengumpulan analisis
kebutuhan pengguna, yang bisa dilakukan dengan cara melakukan wawancara
terhadap anggota yang sesuai, contohnya pengguna dibidang pemasaran,
keuangan, penjualan, operasional, dan manajemen untuk mengidentifikasi satu set
kebutuhan yang terprioritaskan bagi perusahaan yang harus dipenuhi oleh data
warehouse. Hasil wawancara menyediakan informasi yang penting bagi top-down
view (kebutuhan pengguna ) dan bottom-up view (dimana sumber data tersedia)
dari data warehouse. Dengan dua pandangan diatas proses merancang data
warehouse sudah dapat dimulai.
Salah satu komponen basis data dalam data warehouse dideskripsikan
dengan menggunakan permodelan dimensionalitas (dimensionality modelling),
yaitu suatu teknik desain secara logis yang bertujuan untuk menyajikan data
dalam suatu bentuk standar dan intuitif yang memungkinkan akses dengan
performansi tinggi. Konsep permodelan dimensionalitas menggunakan konsep
dari permodelan entity-relationship (ER) dengan beberapa pembatasan penting.
Setiap model dimensionalitas terdiri dari satu tabel dengan satu composite
primary key (PK) yang dikenal sebagai tabel fakta (fact tabel), serta satu lagi tabel
yang lebih kecil yang dikenal sebagai tabel dimensi (dimension tabel).
Setiap tabel dimensi memiliki satu primary key yang berkorespondensi
dengan satu komponen dari composite key dalam tabel fakta. Dengan kata lain,
primary key dari tabel fakta terdiri dari dua atau lebih foreign key. Karakteristik
yang memiliki bentuk seperti bintang ini dikenal sebagai star schema atau star
join atau skema bintang.
2.1.7.1 Skema Bintang (Star Schema)
Menurut Connolly (2005, p1183), skema bintang adalah struktur
logikal yang mempunyai sebuah tabel fakta yang berisi data fakta di
tengah dan dikelilingi oleh tabel-tabel dimensi yang berisi data referensi
atau keterangan yang biasanya dapat denormalisasi.
Gambar 2.10 Star Schema
(Sumber : Connolly, 2005, p1184)
2.1.7.1.1 Tabel Facta (Fact Table)
Menurut Connolly dan Begg (2005, p1183), “Every
dimensional model (DM) is composed of one table with a
composite primary key, called the fact table”, yang berarti tabel
fakta adalah suatu tabel pada Dimensional Model (DM) yang
isinya composite primary key (PK). Jadi PK pada tabel fakta
merupakan beberapa foreign key.
2.1.7.1.2 Tabel Dimensi (Dimenstion Table)
Menurut Connolly dan Begg (2005, p1183), “Dimensional
table is a set of smaller tables called dimension tables”, yang
berarti tabel dimensi adalah sekumpulan tabel-tabel yang lebih
kecil dari tabel fakta pada dimensional model (DM). Setiap
tabel dimensi mempunyai non-composite Primary Key.
2.1.7.1.3 Surrogate key
Menurut http 1, A surrogate key is an artificially produced
value, most often a system-managed, incrementing counter
whose values can range from 1 to n, where n represents a
table's maximum number of rows. In SQL Server, create a
surrogate key by assigning an identity property to a column
that has a number data type. A natural key is a naturally
occurring descriptor of the data and one of a table's attributes
that has no duplicate values. When use a natural key as a table's
primary key, each of the table's rows is uniquely identified.
Artinya, sebuah nilai yang dihasilkan secara buatan, sistem
yang paling sering dikelola, penambahan nilai-nilai yang dapat
berkisar dari 1 hingga n, dimana n merupakan jumlah angka
maksimum dari baris yang ada pada tabel. Dalam SQL Server,
membuat surrogate key dengan menetapkan identitas pada
kolom yang memiliki sejumlah tipe data. Kunci yang secara
alami menjadi deskripsi dari data dan salah satu atribut dari
tabel tidak bernilai ganda. Ketika menggunakan kunci tersebut
sebagai sebuah primary key dari tabel, masing-masing baris
pada tabel secara unik teridentifikasi.
2.1.7.2 Keuntungan Skema Bintang
Skema bintang memiliki keuntungan yang tidak didapat oleh skema
relasional biasa. Keuntungan skema bintang, antara lain:
• Respon data yang lebih cepat dihasilkan dari perancangan
database.
• Kemudahan dalam mengembangkan atau memodifikasi data yang
terus berubah.
• End user dapat menyesuaikan cara berpikir dan menggunakan
data, konsep ini dikenal juga dengan istilah pararel dalam
perancangan database.
• Menyederhanakan pemahaman dan penelusuran metadata bagi
pemakai dan pengembang.
2.1.8 Arsitektur Data Warehouse
2.1.8.1 Centralized Data Warehouse
Centralized data warehouse ini merupakan database fisikal tunggal
yang memuat semua data untuk area fungsional yang khusus, departemen,
divisi, atau perusahaan. Data warehouse ini digunakan ketika terdapat
kebutuhan akan data informasional dan terdapat banyak end-user yang
sudah terhubung ke komputer pusat atau jaringan.
Bentuknya menyerupai functional data warehouse, akan tetapi
sumber datanya lebih dahulu dikumpulkan atau diintegrasikan pada suatu
tempat terpusat, baru kemudian data tersebut dibagi berdasarkan fungsi-
fungsi yang dibutuhkan oleh perusahaan. Bentuk data warehouse terpusat
ini sering digunakan oleh perusahaan-perusahaan yang belum mempunyai
jaringan eksternal.
Keuntungan bentuk centralized data warehouse ini adalah data
benar-benar terpadu karena konsistensi yang tinggi. Namun demikian
membutuhkan waktu yang lama dan biaya yang mahal dalam membentuk
data warehouse seperti ini.
Gambar 2.11 Centralized Data Warehouse
2.1.9 ETL (Extract,Transform,Loading)
Menurut Silvers(2008,p150) ETL (Extract, Transform, Load) adalah
proses-proses dalam data warehouse yang meliputi:
• Mengekstrak data dari sumber-sumber eksternal.
• Mentransformasikan data ke bentuk yang sesuai dengan keperluan bisnis.
• Memasukkan data ke target akhir, yaitu data warehouse.
ETL merupakan proses yang sangat penting, dengan ETL data dapat
dimasukkan ke dalam data warehouse. ETL juga dapat digunakan untuk
mengintegrasikan data dengan sistem yang sudah ada sebelumnya.
Tujuan ETL adalah mengumpulkan, menyaring, mengolah, dan
menggabungkan data yang relevan dari berbagai sumber untuk disimpan ke dalam
data warehouse. Hasil dari proses ETL adalah dihasilkannya data yang memenuhi
kriteria data warehouse seperti data historis, terpadu, terangkum, statis, dan
memiliki struktur yang dirancang untuk keperluan proses analisis.
Extract
Langkah pertama pada proses ETL adalah mengekstrak data dari
sumber-sumber data. Kebanyakan proyek data warehouse
menggabungkan data dari sumber-sumber yang berbeda. Pada hakekatnya,
proses ekstraksi adalah proses penguraian, pembersihan dari data yang
diekstrak untuk mendapatkan struktur atau pola data yang diharapkan.
Transform
Tahapan transfomasi menggunakan serangkaian aturan atau fungsi
untuk mengekstrak data dari sumber dan selanjutnya akan dimasukkan ke
dalam data warehouse. Berikut adalah hal- hal yang dapat dilakukan
dalam tahap transformasi :
o Hanya memilih kolom tertentu saja untuk dimasukkan ke dalam
data warehouse.
o Menterjemahkan nilai-nilai yang berupa kode (contohnya apabila
database sumber menyimpan nilai 1 untuk laki- laki dan nilai 2
untuk perempuan, tetapi data warehouse yang telah ada
menyimpan M untuk laki-laki dan F untuk perempuan, ini disebut
dengan automated data cleansing, tidak ada pembersihan secara
manual yang ditunjukkan selama proses ETL.
o Mengkodekan nilai-nilai ke dalam bentuk bebas (contohnya
memetakan “Male”, “1” dan “Mr” ke dalam M).
o Melakukan perhitungan nilai-nilai baru (contohnya sale_amount =
qty * unit_price).
o Menggabungkan data secara bersama-sama dari berbagai sumber.
o Membuat ringkasan dari sekumpulan baris data (contohnya total
penjualan untuk setiap toko atau setiap bagian).
Loading
Fase load merupakan tahapan yang berfungsi untuk memasukkan
data ke dalam target akhir, yang biasanya ke dalam suatu data warehouse.
Jangka waktu proses ini tergantung pada kebutuhan organisasi. Beberapa
data warehouse dapat setiap minggu menulis keseluruhan informasi yang
ada secara kumulatif, data diubah, sementara data warehouse yang lain
(atau bagian lain dari data warehouse yang sama) dapat menambahkan
data baru dalam suatu bentuk historikal, contohnya setiap jam. Waktu dan
jangkauan untuk mengganti atau menambah data tergantung dari
perancangan data warehouse pada waktu menganalisis keperluan
informasi.
Gambar 2.12 Extract, Transform, Load (ETL)
(Sumber : Silvers, 2008, p152)
2.1.10 Metadata
Menurut Paulraj Ponniah(2001,p36), metadata dalam sebuah
datawarehouse di bagi ke dalam 3 kategori utama :
• Operational Metadata
Data untuk data warehouse berasal dari beberapa sistem operasional
dari perusahaan. Sumber sistem ini mengandung struktur data yang
berbeda. Elemen data yang dipilih untuk data warehouse mempunyai
bermacam-macam field lengths dan tipe data. Dalam memilih data dari
sumber sistem untuk data warehouse, record harus dipisahkan,
menggabungkan bagian-bagian records dari sumber file yang berbeda dan
membuat kesepakatan dengan skema pengkodingan ganda dan field
lengths. Ketika informasi dikirim kepada end user, harus dapat
menghubungkan kembali ke kumpulan sumber data yang asli. Operasional
metadata mengandung semua informasi mengenai operasional sumber
data.
• Extraction and Transformation Metadata
Extraction dan Transformation Metadata mengandung data mengenai
ekstraksi data dari sumber sistem, yakni ekstraksi frekuensi, ekstraksi
metode dan aturan-aturan bisnis untuk ekstraksi data. Juga, kategori dari
metadata ini mengandung informasi tentang semua transformasi data yang
mengambil tempat dalam data staging area.
• End-User Metadata
End-User Metadata merupakan peta navigasi dari data warehouse.
Hal ini memungkinkan end-user untuk menemukan informasi dari data
warehouse. End-user metadata mengijinkan end-user untuk
menggunakan terminologi bisnis milik mereka sendiri dan mencari
informasi dalam cara itu dimana mereka secara normal berpikir mengenai
bisnis.
2.1.11 Fact Finding
Menurut Connolly dan Begg (2005, p317- 321), fact finding adalah proses
formal yang menggunakan teknik-teknik seperti wawancara dan kuesioner untuk
mengumpulkan fakta-fakta mengenai sistem, persyaratan dan preferensi. Metode yang
digunakan fact finding adalah :
1. Wawancara
Wawancara adalah yang paling sering digunakan, dan biasanya
paling berguna, teknik pencarian fakta. Kita dapat wawancara untuk
mengumpulkan informasi dari individu melalui tatap muka. Ada beberapa
tujuan dapat menggunakan wawancara, seperti mencari tahu fakta,
memverifikasi fakta, mengklarifikasi fakta, menghasilkan antusiasme,
mendapatkan pengguna akhir yang terlibat, mengidentifikasi kebutuhan,
dan mengumpulkan ide - ide dan pendapat. Akan tetapi, dengan
menggunakan teknik wawancara membutuhkan keterampilan komunikasi
yang baik untuk berurusan secara efektif dengan orang - orang yang
memiliki nilai yang berbeda, prioritas, opini, motivasi, dan kepribadian.
seperti fakta lain teknik wawancara tidak selalu merupakan metode terbaik
untuk semua situasi.
Terdapat dua macam tipe interview: tidak terstruktur dan
terstruktur.
Wawancara tidak terstruktur dilakukan hanya dengan tujuan
umum dalam pikiran dan dengan sedikit, jika ada, pertanyaan - pertanyaan
spesifik. Pewawancara menghitung pada orang yang diwawancara untuk
menyediakan kerangka kerja dan arah untuk wawancara. Wawancara jenis
ini sering kehilangan fokus, karena alasan ini, sering kali tidak berfungsi
dengan baik untuk analisis dan desain database.
Wawancara terstruktur, pewawancara memiliki serangkaian
pertanyaan khusus untuk meminta diwawancarai. tergantung pada respon
orang yang diwawancara, pewawancara akan langsung menambah
pertanyaan-pertanyaan untuk mendapatkan klarifikasi atau ekspansi.
Untuk memastikan kesuksesan wawancara meliputi memilih
individu yang sesuai untuk wawancara, mempersiapkan secara ekstensif
untuk wawancara, dan melakukan wawancara yang efisien dan efektif.
Tabel 2.5 Keuntungan dan Kelemahan Menggunakan Wawancara sebagai Teknik Fact
Finding (Connolly dan Begg, 2005, p318)
2. Mengamati perusahaan beroperasi
Pengamatan adalah salah satu yang paling efektif teknik pencarian
fakta untuk memahami sebuah sistem. Dengan teknik ini, mungkin baik
untuk berpartisipasi , atau menonton, orang yang melakukan kegiatan
untuk belajar tentang sistem. Teknik ini terutama bermanfaat bila validitas
data yang dikumpulkan melalui metode lain yang terkait atau ketika
kompleksitas aspek-aspek tertentu dari sistem mencegah penjelasan yang
jelas oleh pengguna akhir, seperti dengan fakta lain teknik, pengamatan
yang sukses membutuhkan persiapan. Untuk memastikan bahwa
pengamatan berhasil, sangat penting untuk mengetahui sebanyak mungkin
tentang individu dan kegiatan yang harus diperhatikan mungkin.
Tabel 2.6 Keuntungan dan Kelemahan Menggunakan Observasi sebagai Teknik Fact
Finding
(Sumber : Connolly, 2005, p319)
2.2. Teori-teori khusus
2.2.1. Sistem Penjualan
Menurut Anita S. Hollander et al. (2000, p230), penjualan adalah kumpulan
kejadian yang secara kolektif melayani untuk menarik pelanggan, membantu
pelanggan untuk memilih barang dan layanan, mengantar barang dan layanan
yang diminta, dan mengumpulkan pembayaran untuk barang dan layanan.
2.2.2. Sistem Pembelian
Menurut Mulyadi (2001, p301), sistem pembelian digunakan dalam
perusahaan untuk pengadaan barang yang diperlukan oleh perusahaan. Fungsi
pembelian pada sistem pembelian bertanggung jawab untuk memperoleh
informasi mengenai harga barang, menentukan pemasok yang dipilih dalam
pengadaan barang, dan mengeluarkan order pembelian kepada pemasok yang
dipilih.
2.2.3. Sistem Pemasaran
Menurut Hendro, & Widhianto, C.W. (2006, p419), Pemasaran adalah
proses kegiatan dalam perusahaan dan manajerial dimana individu, kelompok atau
perusahaan mendapatkan apa yang mereka butuhkan atau harapkan melalui
penciptaan, penawaran dan pertukaran segala sesuatu yang bernilai dengan orang
lain atau kelompok yang lain.