kisi kisi uts dw

7

Click here to load reader

Upload: yan-cita-bagoez

Post on 09-Feb-2016

242 views

Category:

Documents


2 download

DESCRIPTION

hgewfhjgwe

TRANSCRIPT

Page 1: Kisi Kisi UTS DW

Kisi kisi UTS

1. Pendahuluan

a. Data WarehouseData Warehouse merupakan koleksi data yang memiliki sifat object-oriented, time-

variant, dan terintegrasi dalam sebuah koleksi data sebagai pendukung dalam proses

pengambilan keputusan. Data Warehouse berperan sebagai gudang data, yang nantinya data-data

yang ada di dalamnya dapat digunakan untuk diolah sewaktu-waktu diperlukan. Data Warehouse

digunakan untuk ruang lingkup yang lebih spesifik seperti pada suatu organisasi atau perusahaan.

b. Fungsi DW

- sebagai tempat menyimpan segala macam data dalam skala besar yang bisa di ambil

sewaktu waktu.

-

c. Keuntungan menggunakan DW

- Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan

transaksi.

- Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah

dapat diatasi.

- Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data

apabila data dipindahkan dari database OLTP ke data warehouse.

- Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.

d. Proses Data Warehouse

Proses dalam data warehouse atau data warehousing (catatan: istilah data warehouse

mengacu ke tempat repository data sementara istilah data warehousing mengacu ke proses

perjalanan data dari berbagai sumber data hingga masuk ke data warehouse) terdiri dari tahap-

tahap berikut ini:

1. Data di-import dari berbagai sumber data internal maupun eksternal

2. Data di-cleansed atau dibersihkan dan diorganisir secara konsisten sesuai dengan

kebutuhan perusahaan

Page 2: Kisi Kisi UTS DW

3. a) Data di-load atau di-export atau dimasukkan ke data warehouse enterprise, atau b).

Data di-load/export/di masukkan ke data marts [tentang definisi data marts bisa dibaca

pada artikel sebelumnya tentang   Data Warehouse dan Beberapa Karakteristiknya di link

ini]

4. a). Bila diinginkan, data marts dibuat sebagai subset atau bagian dari EDW (enterprise

data warehouse), atau b) Data marts disatukan menjadi EDW

5. Analisa dilakukan ketika diperlukan

Apa saja yang menjadi komponen-komponen utama dari suatu data warehouse?

Data sources: data bersumber dari berbagai sistem operasional dan mjngkin juga berasal

dari berbagai sumber data eksternal.

Data extraction: Data di-ekstrak dengan menggunakan software komersial atau bisa juga

software yang dibuat sendiri yang biasa disebut dengan istilah ETL (Extract-Transform-

Load)

Data loading: Data di-load/dimasukkan dalam staging area, dimana data di transform

dan dibersihkan. Data kemudian siap untuk di-load ke data warehouse.

Comprehensive database: Ini adalah EDW (Enterprise Data Warehouse) yang

mendukung analisa pengambilan keputusan dengan memberikan informasi detil dan

ringkas yang relevan.

Metadata: Metadata di-maintain untuk akses oleh pengguna dan staf IT. Metadata

meliputi berbagai rules untuk mengorganisir ringkasan data yang mudah untuk di-index

dan di-search

Middleware tools: Middleware tools memungkinkan akses ke data warehouse dari

berbagai aplikasi front-end.

2. Data Warehouse dan DM

a. Perbedaan DW dan DM

Teknologi data warehouse digunakan untuk melakukan OLAP (On-line Analytical

Processing) , sedangkan data mining digunakan untuk melakukan information discovery

yang informasinya lebih ditujukan untuk seorang Data Analyst dan Business Analyst

(dengan ditambah visualisasi tentunya). Dalam prakteknya, data mining juga mengambil

Page 3: Kisi Kisi UTS DW

data dari data warehouse. Hanya saja aplikasi dari data mining lebih khusus dan lebih

spesifik dibandingkan OLAP mengingat database bukan satu-satunya bidang ilmu yang

mempengaruhi data mining.

3. Arsitektur Dw

- Data warehouse itu sendiri, yang terdiri dari data-data dan software yang berasosiasi. - Data acquisition (back-end) software, yang mengekstrak data dari system legal dan

sumber-sumber eksternal, mengkonsolidasi dan merangkumnya, dan memprosesnya ke dalam data warehouse.

- Client (front-end) software, yang mengijinkan user mengakses dan menganalisis data dari

warehouse

4. Big Data

Big Data adalah sebuah teknologi baru di dunia teknologi informasi dimana memungkinan

proses pengolahan, penyimpanan dan analisis data yang sangat kompleks dalam beragam

bentuk/format (Variety), berjumlah besar (Volume) dan pertambahan data yang sangat cepat

Page 4: Kisi Kisi UTS DW

(Velocity). Pengolahan dan analisis data dalam jumlah sangat besar ini memerlukan waktu yang

relatif jauh lebih singkat dengan menggunakan Big Data dibanding teknologi data sebelumnya,

misalnya relational database seperti MySQL.

5. DW dan D mart

a. Data mart

Data Mart merupakan bagian dari Data Warehouse yang mendukung pada tingkat departemen

atau fungsi bisnis tertentu pada perusahaan dengan kata lain, sebuah data mart adalah bentuk

sederhana dari sebuah gudang data yang difokuskan pada subjek tunggal (atau area fungsional), seperti

Penjualan, Keuangan, atau Marketing. Data Mart sering dibangun dan dikendalikan oleh satu

departemen dalam sebuah organisasi. Mengingat subjek tunggal fokus departemen tersebut, data mart

biasanya menggambar data dari hanya beberapa sumber. Sumber bisa sistem operasional internal, data

warehouse pusat, atau data eksternal.

b. ETL

Proses ETL (Extraction, Transformation, Loading) merupakan proses yang harus dilalui dalam

pembentukan data warehouse. ETL adalah suatu proses mengambil dan mengirim data dari data

sumber ke data warehouse. Dalam proses pengambilan data, data harus bersih agar didapat kualitas

data yang baik. Contohnya ada nomor telepon yang invalid, ada kode buku yang tidak eksis lagi, ada

beberapa data yang null, dan lain sebagainya. Pendekatan tradisional pada proses ETL mengambil data

dari data sumber, meletakan pada staging area, dan kemudian mentransform dan meng-load ke data

warehouse.

c. ELT

ELT merupakan variasi dari ETL (Extraction, Transformation, Loading). ELT memungkinkan data

mentah dimuat secara langsung pada data warehouse yang kemudian akan transformasi pada aata

warehouse tersebut. Kemampuan ini sangat berguna untuk memproses set data yang besar yang

diperlukan untuk Business Intelligence dan analisis data yang besar. Salah satu kemampuan utama ELT

adalah pengurangan waktu loading jika dibandingkan dengan model ETL. Mengambil keuntungan dari

kemampuan pemrosesan yang dibangun dalam infrastruktur data warehouse dapat mengurangi waktu

yang dihabiskan data untuk melakukan transit dan lebih hemat biaya.

d. OLAP

OLAP adalah singkatan dari Online Analytical Processing. OLAP digunakan untuk pengambilan

keputusan, OLAP berguna dalam melakukan analisis data yang sudah ada untuk membantu dalam

Page 5: Kisi Kisi UTS DW

pengambilan keputusan di masa yang akan datang. OLAP merupakan teknologi yang memproses data di

dalam database dalam struktur multidimensi, menyediakan jawaban yang cepat untuk query dan

analisis yang kompleks. Data yang disajikan biasanya merupakan suatu fungsi agregasi

seperti summary (rangkuman), max (nilai maksimum), min (nilai minimum), average (rata-rata), dan

sebagainya.

e. OLTP

OLTP adalah singkatan dari Online Transaction Processing. OLTP merupakan suatu aplikasi atau program

yang digunakan dalam operasional perusahaan sehari-hari seperti melakukan insert (memasukan

data), update (mengubah data) dan delete (menghapus data) berbagai macam data, seperti penjualan,

pembelian, produksi dan lain sebagainya. OLTP bertujuan untuk memproses suatu transaksi secara

langsung melalui komputer yang tergabung didalam jaringan. Contohnya seperti aplikasi yang digunakan

minimarket dalam melayani penjualan, jika ada suatu transaksi penjualan, seorang kasir dapat langsung

memasukan data kedalam aplikasi yang terhubung didalam jaringan, sehingga pemrosesan data

terbantu oleh adanya OLTP tersebut. Berdasarkan datanya, OLTP menggunakan data asli atau hari ini

dan dapat di update setiap saat. OLTP biasanya memiliki ukuran yang relatif kecil.

Cloud Based