Hai guys, akhirnya admin muncul lagi yaa setelah sekian lama bertapa dari dunia tulis menulis blogger. Kali ini admin mulai membahas sesuatu yang berbeda. Di postingan admin sebelumnya, memang admin lagi gencar-gencarnya bahas manajemen, tapi kali ini, admin akan bahas mengenai Data Cleansing dan Data Matching pada DQS SQL Server. Oiya nih, pasti kalian bertanya tanya, admin ini anak mana sih, kok bahasannya ekonomi ada, IT ada, kan bingung(?). Okayy, admin ini mahasiswi semester 3 program studi Sistem Informasi di salah satu institut swasta ternama di Surabaya, Institut Bisnis dan Informatika Stikom Surabaya. Oke langsung aja ya ke bahasan utama kitaaa;)
Jadi materi postingan kali ini membahas tahap awal sebelum melakukan data cleansing dan data matching. Admin akan bahas step by step nya, jadi perhatikan baik-baik yaa. Sebelumnya, kalian bisa unduh data pendukung materi ini di link berikut yaa:)) AdventureWorks-SampleData
- Step I : Melakukan import data DQS yang telah disediakan.
Di step pertama ini, kalian import terlebih dahulu file dqs yang kalian unduh pada link "AdventureWorks-SampleData" diatas. Setelah kalian masuk ke aplikasi DQS SQL Server, kalian akan menemukan tampilan 3 pilihan fasilitas yang diberikan aplikasi. Pilih saja "Knowledge Base Management" dan create New Knowledge Base. Setelah melalukan klik pada button pilihan tersebut, maka muncullah tampilan seperti di atas. Tampilan tersebut berisi pilihan untuk create Knowledge Base, pilih saja import from DQS Server, lalu browse file berformat .dqs yang telah saya share. Lalu pilihlah activity Domain Knowledge dan klik Next.
- Step II : Domain Management
Pada domain management, kalian akan diperlihatkan apa saja domain yang telah tersedia/dibuat.
Pada step ini, kalian dipersilakan untuk menentukan Domain Rules (Aturan yang berlaku pada domain) dan menentukan Domain values (Aturan data apa saja yang boleh ditampilkan). Pada Domain Birth Date, type data yang digunakan date, maka type data sample yang diimputkan nanti nya harus sama dengan type data domain tersebut.
Pada Domain Email Address, type data yang digunakan yaitu String, dikarenakan email yang keluar pastilah dalam bentuk huruf dan angka bukan hitungan. Maka type data
sample yang diimputkan juga nanti nya harus sama dengan type data domain tersebut. Lalu, dalam domain rules, pastikan ada aturan yang menjelaskan bahwa email user wajib mengandung @adventure-works.com di akhir email. Sehingga, dapat menghindari typo atau salah input email.
Pada Composite Domain Employee Name, masukkan Domain First Name, Middle Name, Last Name untuk menemukan nama lengkap karyawan.
Pada Domain First, domain first terkoneksi dengan domain first name. Fungsi dari Domain First sendiri yaitu untuk keperluan pengambilan data pada composite domain Sales Validation.
Pada Domain Gender, jangan lupa pastikan bahwa domain values telah di atur dimana data yang dianggap pantas untuk ditampilkan dan sebagai acuan yaitu telah di klik type corrected pada values F(Female) dan M(Male).
Pada Domain Job Title, terdapat pula Domain Values yang telah terdata lumayan banyak untuk persiapan pengecekan kelayakan data dan menghindari penulisan pekerjaan karyawan yang salah atau typo. Jangan lupa juga untuk klik type corrected agar dapat menjalankan hasil sesuai tujuan.
Pada Composite Domain Sales Validation, masukkan Domain First, Last, Sales Quota, dan Sales YTD untuk menemukan nama sales yang tervalidasi. Selain itu, pada CD Rules, juga ditetapkan aturan dimana, jika values Sales Quota 3000000 maka sales YTD lebih besar atau sama dengan 3000000 (lihat gambar).
Pada Domain Title, juga ditetapkan Domain Values Mr. untuk laki-laki dan Mrs. or Ms. untuk perempuan dimana klik type adalah corrected untuk menjamin data yang sesuai dapat ditampilkan.
Pada Composite Domain Title Enrichment terisi oleh Domain Gender, Marital Status dan Title. Selain itu, juga terdapat CD Rules untuk mengatur data, Jika Gender sama dengan M, maka Title yang digunakan adalah Mr. Begitu pula dengan single female untuk Title Ms, dan married female untuk Mrs.
- Step III : Finishing
Step terakhir proses import data adalah klik finish pada sisi kiri bawah dan melakukan publishing data yang telah di importkan.
Okayy sekian dulu ya bahasan TUTORIAL DQS SQL SERVER DATA CLEANSING & DATA MATCHING [PART IMPORT DATA]. Buat kalian yang kepo tentang tahapan-tahapan selanjuutnya, pantengin terus blog aku yaa. Jika kalian punya pengetahuan lebih terkait postingan kali ini, kalian bisa berbagi di kolom comment. Thankyouuu. See youu:))
0 comments:
Post a Comment