Selasa, 21 Oktober 2014

Tugas Resume DATA WEREHOUSE pert 6

       Ada dua pendekatan yang diterima sebagai “best practice” untuk memodelkan data pada dw:
  1. Relational Model (Immon Approach)
  2. Multidimensional Model (Kimball Approach)
Relational Model

       Model relasional telah ada sejak tahun 70 an dan telah diimplementasikan pada teknologi mesindatabase seperti DB2, oracle, SQL Server dsb.
       Tiap database dapat terdiri dari satu atau lebih table yang saling berhubungan (memiliki relasi)
       Tiap table terdiri dari kolom yang bertindak sebagai atribut dari data, masing2 kolom dapat memiliki karakteristik yang berbeda.


       Dalam model relasional, data harus hadir dalam bentuk normal
       Maksudnya normal ialah data telah tersusun dalam desain yang granularitasnya rendah.
       Kelebihan dari model ini ialah desain yang disiplin dengan data yang detail.
1.       Model ini fleksibel dan adaptif untuk dimanfaatkan dari berbagai sudut pandang dan kebutuhan.
2.       Berbagai jenis “view” dapat ditampilkan oleh model ini.
       Kekurangan model ini ialah tingkat komplesitas yang tinggi seiring dengan bertumbuhnya jenis informasi. Untuk menampilkan sebuah “view” yang spesifik

Dimensional Model

       Sering juga disebut dengan multidimensional approach, star join approach, atau kimball approach
       Strukturnya seperti bintang yang berelasi, (star-join)
       Di tengah terdapat tabel fakta yang dikelilingi oleh tabel dimension
       Kelebihan model ini ialah terfokus untuk menampilkan sebuah “view” khusus, sehingga tidak fleksibel untuk kebutuhan umum

       Tabel fakta menyimpan data utama, berisi jumlah data teragregasi yang banyak seperti harga dan jumlah penjualan.
       Tabel dimensi, umumnya lebih kecil dari tabel fakta berisi atribut yang menjelaskan tabel fakta, umumnya tabel terpisah untuk tiap atribut.


Perbedaan relational dengan Dimensional

       Dimensional model memiliki scope (ruang lingkup) yang lebih kecil, karena requirement menentukan bentuk dari model.
       Cocok untuk req departement atau sub departement
       Dimensional model akan mengalami kesulitan saat banyak req proses bermunculan untuk memanfaatkan data.
       Secara sederhana, dimensional model hanya bisa dioptimasi untuk satu proses req.
       Relational model tidak memiliki optimasi, karena disimpan pada level granularitas terendah.
       Tidak ada batasan untuk mengolah relational model, sehingga cocok untuk scope yang luas (model enterprise)





Independent data mart

       Aspek lain dari multidimensional model ialah independent data mart.
       Data mart ialah struktur data yang di dedikasikan untuk melayano fungsi analitis dari sebuah group, seperti departement accounting atau departement finance.
       independent data mart ialah data mart yang dibangun langsung dari legacy applications.

       Independent data marts sangat menarik karena memungkinkan solusi untuk memecahkan permasalahan informasi pada sebuah bagian.
       independent data mart dapat dibuat oleh sebuah departemen tanpa memperhitungkan kebutuhan departemen lain atau data it terintegrasi, tidak diperlukan untuk “berpikir global” saat membuatnya.
       Independent merepresentasikan subset dari keseluruhan req DSS, murah dibuat, dan popular.

       Pendekatan lain dari pengembangan data mart ialah dependent data mart
       Pada dependent data mart, data disusun dan dibuat dari data warehouse yang telah ada
Sumber dari mahergabayu.blogspot.com

Selasa, 14 Oktober 2014

Tugas Datawerehouse 3 pert6

Star Schema
Desain Star Schema adalah struktur sederhana yang berhubungan dengan beberapa tabel dan didefinisikan dengan join path. Desain database ini sangat kontras dengan struktur normal untuk database proses transaksi, menyediakan query yang cepat sesuai respon waktu, dan skema sederhana yang dapat dengan mudah dimengerti end user dan analis, waulupun mereka be1um terbiasa dengan struktur database (Poe, 1996, pp120-121). 


 dan berikut adalah star schema yang sudah di normalisasikan



Snowflake
Snowflake schema adalah jenis variasi star schema yang terlihat menyerupai butiran salju. Berisitabel dimensi dan fact tabel. Dimana tabel dimensi tersebut dinormalisasi menjadi sebuah hirarkiyang terorganisasi. Tujuan dari normalisasi tabel dimensi adalah mengurangi redudancy. Tujuannya untuk memelihara kapasitas disk atau memori.
 Didalam data warehouse bisa terdapat star - snowflake schema apabila :
- terdapat root yang unik.
- Setiap reference didalam poin root menuju ke subgraph didalam data warehouse graph.


Rabu, 08 Oktober 2014

Tugas Datawarehouse 2

Arsitektur Data Warehouse
Sebuah sistem data warehouse memiliki dua arsitektur utama yaitu data flow architecture dan system architecture . Dataflow architecture adalah tentang bagaimana menyimpan data tersebut diatur dalam sebuah gudang data dan bagaimana data mengalir dari sistem sumber ke pengguna melalui menyimpan data tersebut . System architecture adalah tentang konfigurasi fisik dari server , jaringan, perangkat lunak , penyimpanan , dan klien .
Arsitektur Aliran Data (Data Flow Architecture)
Single DDS (DDS Tunggal)
Pada bagian ini , Anda akan belajar tentang arsitektur aliran data sederhana yang hanya terdiri dari dua data store yaitu stage dan DDS . Dalam arsitektur ini, menyimpan data warehouse inti dalam format dimensional .
Dalam arsitektur DDS tunggal , Anda memiliki menyimpan data satu dimensi . DDS terdiri dari satu atau beberapa dimensi data mart . Sebuah dimensi data mart adalah sekelompok tabel fakta terkait dan tabel dimensi yang sesuai yang berisi pengukuran kegiatan bisnis dan dikategorikan berdasarkan dimensi.
Keuntungan dari arsitektur DDS tunggal yaitu struktur arsitektur yang lebih sederhana dari tiga struktur arsitektur berikutnya . Hal ini dikarenan data daristage dimuat langsung ke penyimpanan data dimensi , tanpa pergi ke setiap jenisstore yang dinormalisasi terlebih dahulu. Kerugian utama adalah bahwa hal itu lebih sulit, dalam arsitektur ini untuk membuat DDS kedua. Sebuah DDS dalam DDS tunggal merupakan store data master yang berisi satu set lengkap data dalam data warehouse.
1
NDS + DDS
Dalam arsitektur aliran data NDS + DDS, ada tiga penyimpanan data yaitu stage, NDS, dan DDS. Arsitektur ini mirip dengan arsitektur DDS tunggal, tetapi memiliki penyimpanan data yang dinormalisasi di depan DDS. NDS dalam bentuk relasional normal ketiga atau lebih tinggi. Tujuan memiliki NDS ada dua. Pertama, mengintegrasikan data dari beberapa sistem sumber. Kedua, mampu memuat data ke dalam beberapa DDSS. Berbeda dengan arsitektur DDS tunggal, dalam arsitektur NDS + DDS Anda dapat memiliki beberapa DDSS.
2
ODS + DDS
Arsitektur ini mirip dengan arsitektur NDS + DDS. Seperti NDS, ODS adalah dalam bentuk normal ketiga atau lebih tinggi. Berbeda dengan NDS, ODS hanya berisi versi terbaru dari data master, ia tidak memiliki data master historis. Struktur entitasnya seperti sebuah database OLTP. ODS tidak memiliki kunci pengganti. Kunci pengganti diselenggarakan dalam ETL DDS.ODS mengintegrasikan data dari berbagai sistem sumber. Data dalam ODS dibersihkan dan terintegrasi. Data mengalir ke ODS telah melewati penyaringan DQ.
3