TUTORIAL DQS SQL SERVER DATA CLEANSING & DATA MATCHING [PART DATA MATCHING]

by November 16, 2017 0 comments
Hai guys, kembali lagi nih sama admin buat cuap cuap bahas materi kuliah Kualitas Data admin. Kali ini admin akan bahas tutorial terakhir admin, yaitu tentaaaang "Data Matching". Jadi disini kita bahas tentang cari similarity dari data, bukan dari sifat seseorang wkwk. Tenang aja, step kali ini jauh lebih singkat kok daripada sebelumnya. Oke langsung aja yaa kalian buka DQS SQL Server kaliaaan;)

- Step I : Mapping
Nah sebelum kalian masuk ke tahap mapping, pasti kalian akan dihadapkan pada 3 pilihan, gausa bingung, langsung aja pilih "Data Quality Project" lalu create New Data Quality Project dan pilih activity "Matching". Setelah kalian klik, pasti kalian akan diarahkan menuju proses mapping. Proses ini untuk melakukan input data yang ada pada data source (baik sql atau excel atau csv). Pilih nama file (file hasil cleansing) nya, lalu kelompokkan data pada data source dengan domain yang tersedia. Setelah proses mapping selesai, klik Next.

- Step II : Matching 
Setelah melakukan mapping, kalian akan diarahkan menuju proses matching. Untuk memulai proses matching, klik button start dan tunggu sampai data profiling, matching rules, matching results terisi lengkap.

Setelah selesai, pofiler secara otomatis akan merekam seluruh kegiatan atau ciri dari data yang telah di inputkan sesuai dengan rules yang kita buat sebagai aturan cleasing dan matching data (cek postingan sebelumnya). 

Selain itu, matching rules juga akan secara otomatis merekam kegiatan matching dan melakukan perbandingan dengan rules yang terekam atau dibuat sebelumnya.

Begitu pula dengan matching results yang akan secara otomatis merekap dan mendata persentase dan diagram tentang data yang similar ataupun tidak, dsb. 

Selain itu, juga terdapat data yang memunculkan data apa saja yang ditemukan match ataupun unmatch beserta persentase similar nya. Setelah semua dirasa cukup, klik Next untuk melanjutkan proses.

- Step III : Export

Step terakhir yaitu export data hasil matching ke dalam file sql, csv, atau excel. Simpan saja kedua data hasil matching (matching results dan survivorship results) dengan pilihan pivot record agar tidak membutuhkan waktu lama pada saat export data dan hasil export tersebut berguna untuk rekap data hasil matching kalian. Setelah export data selesai, kalian dapat klik finish untuk melakukan publikasi kegiatan olah data.


Okayy sekian dulu ya bahasan TUTORIAL DQS SQL SERVER DATA CLEANSING & DATA MATCHING [PART DATA MATCHING]. Jika kalian punya pengetahuan lebih terkait postingan kali ini, kalian bisa berbagi di kolom comment. Thankyouuu. See youu:))

0 comments:

Post a Comment