- Back to Home »
- datamining , Kuliah , Semester VI »
- Data Mining
Posted by :
Unknown
Selasa, 17 Maret 2015
Data mining merupakan salah satu ilmu dalam cabang informatika, dari namanya saja mungkin terdengar mengarik karna berkaitan dengan data atau secara singkat lebih mendalami data sehingga bisa dibentuk sebuah informasi untuk lebih jelasnya bisa dilihat pengertian dari data mining yang dikutip dari wikipedia adalah sebagai berikut.
Penggalian data (bahasa Inggris: data mining) adalah
ekstraksi pola yang menarik dari data dalam jumlah besar . Suatu pola dikatakan
menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui
sebelumnya, dan berguna. Pola yang disajikan haruslah mudah dipahami, berlaku
untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan
baru. Penggalian data memiliki beberapa nama alternatif, meskipun definisi
eksaknya berbeda, seperti KDD (knowledge discovery in database), analisis pola,
arkeologi data, pemanenan informasi, dan intelegensia bisnis. Penggalian data
diperlukan saat data yang tersedia terlalu banyak (misalnya data yang diperoleh
dari sistem basis data perusahaan, e-commerce, data saham, dan data
bioinformatika), tapi tidak tahu pola apa yang bisa didapatkan.
Proses Pencarian Pola
Penggalian data adalah salah satu bagian dari proses
pencarian pola. Berikut ini urutan proses pencarian pola :
·
Pembersihan Data: yaitu menghapus data
pengganggu (noise) dan mengisi data yang hilang.
·
Integrasi Data: yaitu menggabungkan berbagai
sumber data.
·
Pemilihan Data: yaitu memilih data yang relevan.
·
Transformasi Data: yaitu mentransformasi data ke
dalam format untuk diproses dalam penggalian data.
·
Penggalian Data: yaitu menerapkan metode cerdas
untuk ekstraksi pola.
·
Evaluasi pola: yaitu mengenali pola-pola yang
menarik saja.
·
Penyajian pola: yaitu memvisualisasi pola ke
pengguna.
Pada dasarnya penggalian data dibedakan menjadi dua fungsionalitas, yaitu deskripsi dan prediksi. Berikut ini beberapa fungsionalitas penggalian data yang sering digunakan:
·
Karakterisasi dan Diskriminasi, yaitu
menggeneralisasi, merangkum, dan mengkontraskan karakteristik data.
·
Penggalian pola berulang, yaitu pencarian pola
asosiasi (association rule) atau pola intra-transaksi, atau pola pembelian yang
terjadi dalam satu kali transaksi.
·
Klasifikasi, yaitu membangun suatu model yang
bisa mengklasifikasikan suatu objek berdasar atribut-atributnya. Kelas target
sudah tersedia dalam data sebelumnya, sehingga fokusnya adalah bagaimana
mempelajari data yang ada agar klasifikator bisa mengklasifikasikan sendiri.
·
Prediksi, yaitu memprediksi nilai yang tidak
diketahui atau nilai yang hilang, menggunakan model dari klasifikasi.
·
Penggugusan/Cluster analysis, yaitu
mengelompokkan sekumpulan objek data berdasarkan kemiripannya. Kelas target
tidak tersedia dalam data sebelumnya, sehingga fokusnya adalah memaksimalkan
kemiripan intrakelas dan meminimalkan kemiripan antarkelas.
·
Analisis outlier, yaitu proses pengenalan data
yang tidak sesuai dengan perilaku umum dari data lainnya. Contoh: mengenali
noise dan pengecualian dalam data.
·
Analisis trend dan evolusi, meliputi analisis
regresi, penggalian pola sekuensial, analisis periodisitas, dan analisis
berbasis kemiripan
sumber :
http://id.wikipedia.org/wiki/Penggalian_data