Apa itu Data mining?

Data Mining adalah disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu data :

  • Data : Fakta yang terekam dan tidak membawa arti
  • Pengetahuan : pola, aturan atau model yang muncul dari data

Sehingga Data Mining sering disebut Knowledge  Discovery in Database (KDD)

Konsep Transformasi :
Data menjadi Informasi setelah itu menjadi pengetahuan

Data :

  • Tidak membawa arti, merupakan kumpulan fakta-fakta tentang suatu kejadian
  • Suatu catataan terstruktur dari suatu transaksi
  • Merupakan materi penting dalam membentuk informasi

Pengetahuan :

Gabungan dari pengalaman, nilai, informasi kontekstual dan juga pandangan pakar yang memberikan suatu framework untuk mengevaluasi dan menciptakan pengalaman baru dan informasi.
Bisa berupa solusi pemecahan masalah, petunjuk suatu pekerjaan dan ini bisa ditingkatkan nilainya, dipelajari dan juga bisa diajarkan kepada yang lain

Definisi Data Mining :
Melakukan ekstraksi untuk mendapatkan informasi penting yang sifatnya implisit dan sebelumnya tidak diketahui, dari suatu data (Witten et al., 2011)
Kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar (Santosa, 2007)

Irisan Bidang Ilmu Data Mining :

  • Statistik : Lebih bersifat teori dan fokus ke pengujian hipotesis
  • Machine Learning : Lebih bersifat heuristik dan fokus pada perbaikan performansi dari suatu teknik learning
  • Data Mining : Gabungan teori dan heuristik, fokus pada seluruh proses penemuan knowledge dan pola termasuk data cleaning, learning dan visualisasi hasilnya
Skip to toolbar