data warehouse pentaho

18
DATA WAREHOUSE “Pentaho Data Integration ETL ” OLEH : NIM : 130030174 NAMA : I WAYAN SUMALYA JENJANG STUDI : STRATA SATU (S1) PROGRAM STUDI : SISTEM INFORMASI SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN TEKNIK KOMPUTER (STMIK) STIKOM BALI

Upload: wayan-sumalya

Post on 11-Jul-2016

77 views

Category:

Documents


6 download

DESCRIPTION

freee

TRANSCRIPT

DATA WAREHOUSE

Pentaho Data Integration ETL

OLEH :

NIM

: 130030174

NAMA

: I WAYAN SUMALYA

JENJANG STUDI: STRATA SATU (S1)

PROGRAM STUDI: SISTEM INFORMASISEKOLAH TINGGI

MANAJEMEN INFORMATIKA DAN TEKNIK KOMPUTER

(STMIK) STIKOM BALI

2016

ETL Data menggunakan Pentaho Data IntegrationBerikut ini akan dijelaskan langkah-langkah melakukan ETL (Ektraction, Tranform, Loading) suatu data menggunakan Pentaho Data Integration versi 6. Dengan menggunakan data input berupa file .CSV , dan file output nantinya berupa file XML. Dalam proses ETL ini juga akan dilkukan penggantian string atau element dari data input sehingga menghasilkan data output yang bersih dan sesuai dengan yang diharapkan.

1. Hala yang pertama harus dilakukan dalam proses ETL adalah menyiapkan data berupa file csv yang akan menjadi data input.

2. Selanjutnya buka aplikasi pentaho dengan double click spoon.bat pada folder data integration

3. Maka akan tampil spalash screen pentaho dan diikuti dialog untuk membuat sebuah repository baru, tekan tanda plus berwarna hijau pada pojok kanan atas, pilih kettle file repository kemudian klik OK, dan selanjutnya tentukan lokasi untuk menyimpan repository tersebut kemudian klik OK.

4. Maka akan tampil form utama atau jendela kerja utama. Setelah form utama pentaho terbuka maka pilih menu file dan klik new transformation.

5. Selanjutnya akan muncul desain box disebelah kiri layar yang digunakan untuk membuat transformation.

6. Pilih folder input kemudian drag dan drop CSV File input ke dalam area kerja pentaho, seperti yang terlihat pada gambar.

7. Selanjutnya masuk ke properties CSV file input dengan cara double klik, maka akan muncul dialog form properties maka pilih file input yang akan digunakan dengan menekan tombol browse. lakukanSetelah file input terpilih maka selanjutnya tekan tobol Get Fields yang ada di bagian bawah dan secara otomatis pentaho akan mengimport file csv yang telah dipilih sebelumnya.

8. Karena file input tidak memiliki header maka dalam pentaho header secara otamoatis terisi nama field_001, field_002 dan seterusnya. Ubah file tersebut sesuai dengan yang diinginkan, kemudian lakukan preview data untuk memastikan nama header field sudah benar dengan menekan tombol preview

9. Untuk pengaturan properties SCV file input sudah selesai dilakukan selanjutnya simpan transformation dengan nama tugas DW, kemudian jalankan transformation dengan cara menekan tombol run yang ada di sebelah kiri atas layar kerja, selanjutnya muncul sebuah form dialog tekan tombol launch, maka akan tampil Execution Result pada bagian bawah area kerja seperti yang ditampilkan gambar berikut ini

10. Untuk pengaturan properties SCV file input sudah selesai dilakukan selanjutnya simpan transformation dengan nama tugas DW, kemudian jalankan transformation dengan cara menekan tombol run yang ada di sebelah kiri atas layar kerja, selanjutnya muncul sebuah form dialog tekan tombol launch, maka akan tampil Execution Result pada bagian bawah area kerja seperti yang ditampilkan gambar berikut ini

11. Proses selanjutnya adalah membuat output file dari transformation ini, target output yang diharapkan adalah berupa file XML, maka buka folder output yang ada pada desain box sebelah kiri layar kerja kemudian pilih folder output dan drag XML output ke dalam area kerja.

12. Untuk memastikan apakah CSV file input dapat di transform menjadi file xml dengan baik maka Hubungkan CSV File input dan XML output dengan cara tekan tombol Shift pada keyboard dan klik CSV file input dan arahkan ke XML output selanjutnya pilih main output of step

13. Lakukan konfigurasi pada properties XML output dengan cara double click pada XML Output, maka akan muncul dialog properties dari xml output tentukan file name dan lokasi penyimpanan file output, selanjutnya pada tab field tekan tombol Get Fields maka secara otomatis field akan terisi oleh data yang ada pada file CSV, selanjutnya pada cocntent type pilih conten pada semua field.

14. Proses konfigurasi XML output selesai, kemudian jalankan transformation dengan cara menekan tombol run yang ada di sebelah kiri atas layar kerja, selanjutnya muncul sebuah form dialog tekan tombol launch, maka akan tampil Execution Result pada bagian bawah area kerja

15. Karena dalam File XML output kita mengharapkan adanya kesamaan penulisan Alamat dan Provinsi antara semua fields maka perlu dilakukan penggantian string. Untuk melakukan hal tersebut perlu ditambahkan Replace in string yang terdapat pada folder transform. Sebelumnya hapus dahulu hop yang menghubungkan CSV file input dan XML output dengan cara klik kanan pada hop dan pilih delete hop.

16. Kemudian drag Replace in string dari folder transform ke area kerja dan hubungkan CSV file input ke Replace In String serta Replace In String ke XML output seperti gambar dibawah

17. Lakukan konfigurasi pada Replace In String dengan cara double click pada Replace In String, maka akan muncul dialog properties kemudian tambahkan fields apa saja yang akan diubah, dalam haal ini akan dilakukan perubahan nama jalan dari JL menjadi jalan pada field alamat dan perubahan nama provinsi dari Jogja menjadi Yogyakarta pada field provinsi. Maka lakukan konfigurasi seperti gambar di bawah ini

18. Proses konfigurasi Replace In String selesai, kemudian jalankan transformation dengan cara menekan tombol run yang ada di sebelah kiri atas layar kerja, selanjutnya muncul sebuah form dialog tekan tombol launch, maka akan tampil Execution Result pada bagian bawah area kerja

Dari gambar diatas terlihat bahwa tranformasi data dari CSV file menjadi XML file dengan pengubahan string pada beberapa field berhasil dilakukan dengan demikian proses ETL menggunakan pentaho selesai.