vETL adalah kumpulan proses menyiapkan data dari operational source untuk
data. Proses ini terdiri dari extracting, transforming, loading, dan
beberapa proses yang dilakukan sebelum dipublikasikan ke
dalam data warehouse. Jadi,
ETL atau extract, transform, loading adalah fase
pemrosesan data dari sumber data masuk ke dalam data warehouse. Tujuan
ETL adalah mengumpulkan, menyaring, mengolah dan
menggabungkan datadata yang relevan dari
berbagai sumber
untuk disimpan ke
dalam data warehouse. ETL juga dapat digunakan untuk mengintegrasikan data dengan sistem
yang sudah ada sebelumnya.
Hasil dari
proses ETL adalah dihasilkannya data yang memenuhi kriteria data
warehouse
seperti data historis, terpadu, terangkum, statis
dan memiliki struktur yang dirancang untuk
keperluan proses analisis.
Berikut ini Tahapan - Tahapan Dari Prosess ETL
EXTRACT
vLangkah pertama dari proses ETL adalah proses penarikan data dari satu atau
lebih sistem operasional sebagai sumber
data (bisa diambil dari
sistem OLTP, tapi bisa juga
dari sumber data di luar system database). Kebanyakan proyek data
warehouse menggabungkan data dari
sumber-sumber yang berbeda. Pada
hakekatnya, proses ekstraksi adalah
proses penguraian dan
pembersihan data yang diekstrak untuk
mendapatkan suatu
pola atau struktur data yang diinginkan.
TTRANSFORMATION
vProses
membersihkan data yang telah diambil pada
proses extract sehingga data itu sesuai
dengan struktur data warehouse atau
data mart. Hal-hal yang dapat dilakukan dalam
tahap transformasi : Hanya
memilih kolom
tertentu saja
untuk dimasukkan ke
dalam data warehouse. Menerjemahkan nilai
berupa kode
(misal, database sumber menyimpan nilai 1 untuk
pria dan 2 untuk
wanita, tetapi
data warehouse menyimpan M untuk
pria dan F untuk
wanita). Proses yang dilakukan disebut automated data cleansing, tidak
ada pembersihan secara
manual selama proses ETL. Mengkodekan nilai-nilai ke dalam
bentuk bebas
( missal memetakan ”male” ,”I”, dan ”Mr ke
dalam ”M”). Melakukan perhitungan nilai-nilai baru (misal
sale_amount = qty*unit_price).
Menggabungkan data dari berbagai sumeber bersama-sama. Membuat ringkasan dari
sekumpulan baris
data (misal, total penjualan untuk setiap
bagian). Kesulitan yang
terjadi pada
proses transformasi adalah
data harus digabungkan dari
beberapa sistem
terpisah, harus
dibersihkan sehingga konsisten dan
harus diagregasi untuk
mempercepat analisis.
LOAD
Fase load
merupakan tahapan yang berfungsi untuk
memasukkan data ke dalam target akhir, yaitu ke
dalam suatu data warehouse. Waktu
dan jangkauan untuk
mengganti atau
menambah data tergantung pada
perancangan data warehouse pada
waktu menganalisa keperluan informasi. Fase
load berinteraksi dengan
suatu database, constraint didefinisikan
dalam skema database
sebagai
suatu trigger
yang
diaktifkan pada
waktu melakukan load data (contohnya
:
uniqueness,referential, integrity, mandatory fields), yang juga berkontribusi untuk keseluruhan tampilan dan kualitas data dari proses ETL.
uniqueness,referential, integrity, mandatory fields), yang juga berkontribusi untuk keseluruhan tampilan dan kualitas data dari proses ETL.
Tidak ada komentar:
Posting Komentar