Hai
guys, kembali lagi nih sama admin buat cuap cuap bahas materi kuliah
Kualitas Data admin. Kali ini admin akan bahas tutorial terakhir admin, yaitu tentaaaang "Data Matching". Jadi disini kita bahas tentang cari similarity dari data, bukan dari sifat seseorang wkwk. Tenang aja, step kali ini jauh lebih singkat kok daripada sebelumnya. Oke langsung aja yaa kalian buka DQS SQL Server kaliaaan;)
- Step I : Mapping
Nah sebelum kalian masuk ke tahap mapping, pasti kalian akan dihadapkan pada 3 pilihan, gausa bingung, langsung aja pilih "Data Quality Project" lalu create New Data Quality Project dan pilih activity "Matching".
Setelah kalian klik, pasti kalian akan diarahkan menuju proses mapping.
Proses ini untuk melakukan input data yang ada pada data source (baik
sql atau excel atau csv). Pilih nama file (file hasil cleansing) nya, lalu kelompokkan data
pada data source dengan domain yang tersedia. Setelah proses mapping
selesai, klik Next.
- Step II : Matching
Setelah
melakukan mapping, kalian akan diarahkan menuju proses matching. Untuk
memulai proses matching, klik button start dan tunggu sampai data
profiling, matching rules, matching results terisi lengkap.
Setelah
selesai, pofiler secara otomatis akan merekam seluruh kegiatan atau
ciri dari data yang telah di inputkan sesuai dengan rules yang kita buat
sebagai aturan cleasing dan matching data (cek postingan sebelumnya).
Selain itu, matching rules juga akan secara otomatis merekam kegiatan matching dan melakukan perbandingan dengan rules yang terekam atau dibuat sebelumnya.
Begitu pula dengan matching results yang akan secara otomatis merekap dan mendata persentase dan diagram tentang data yang similar ataupun tidak, dsb.
Selain itu, juga terdapat data yang memunculkan data apa saja yang ditemukan match ataupun unmatch beserta persentase similar nya. Setelah semua dirasa cukup, klik Next untuk melanjutkan proses.
- Step III : Export
Step
terakhir yaitu export data hasil matching ke dalam file sql, csv, atau
excel. Simpan saja kedua data hasil matching (matching results dan survivorship results) dengan pilihan pivot record agar
tidak membutuhkan waktu lama pada saat export data dan hasil export tersebut
berguna untuk rekap data hasil matching kalian. Setelah export data
selesai, kalian dapat klik finish untuk melakukan publikasi kegiatan
olah data.
Okayy
sekian dulu ya bahasan TUTORIAL DQS SQL SERVER DATA CLEANSING &
DATA MATCHING [PART DATA MATCHING]. Jika kalian
punya pengetahuan lebih terkait postingan kali ini, kalian bisa berbagi
di kolom comment. Thankyouuu. See youu:))
0 comments:
Post a Comment