uswatun choriyati – tugas algoritma C.45 / Decision Tree


l1


Total  record = 12 record, terdiri dari:
Ya        = 7 record  | Tidak   = 5 record

Langkah-langkah menghitung menggunakan metode Algoritma C.45

1.Hitung Entropi

rumus-entropi

entropi1

 

 

 

 

 

 

dataset

2.Hitung Gain

1

sebelum mencari Gain, maka mencari nilai entropi masing-masing atribut terlebih dahulu:

# Gain Pelatih

pengertian-entropi

 

 

 

 

 

 

menekan-entropi

 

 

 

 

 

 

gain-pelatih

 

 

 

analisa

 

 

 

 

 

 

 

 

Kemudian pada Mental Grogi, memiliki 4 kasus dan semuanya memiliki jawaban Tidak (sum(total)/sum(tidak) = 4/4 = 1), dengan demikian Mental grogi menjadi daun atau leaf.

pohon1

#Node 1.1

Berdasarkan pembentukan pohon keputusan node 1 (root node), node 1.1 akan dianalisi lebih lanjut. Untuk mempermudah, tabel 1 difilter, dengan mengambil data yang memiliki Mental = PD sehingga jadilah Tebel 3.

tabel3

Kemudian data di tabel 3 dianalisi dan dihitung lagi entropi stribut Mental PD dan entropi setiap atribut serta gainnya sehingga hasilnya seperti data pada Tabel 4, setelah itu tentukan pilih atribut yang memiliki gain tertinggi untuk dibuatkan node berikutnya.

hasil-node

 

 

 

 

 

 

 

 

Dari tabel 4, gain tertinggi ada pada atribut latihan, dan nilai yang dijadikan daun atau leaf adalah rutin dan jarang. Dari data diatas maka dapat diambil kesimpulan bahwa algoritma C.45 pada kasus ini, berhenti pada tahap ini Karena nilai yang terdapat pada atribut latihan semua nilainya mutlak. Jika dievaluasi maka pohon keputusan tampak sperti gambar 2.

pohon-akhir

 

 

 

tugas data minning pak ruri “algoritma naive bayes”

penentuan menikah atau tidak menggunakan algoritma naive bayes

No usia pekerjaan Pendapatan rumah Menikah
1 <= 25 swasta low Tidak punya tidak
2 <= 25 PNS medium punya tidak
3 25 .. 35 pengusaha high punya ya
4 > 35 swasta high punya ya
5 25 .. 35 swasta medium Tidak punya Ya
6 > 35 PNS medium Tidak punya Tidak
7 > 35 pengusaha high punya Tidak
8 <= 25 swasta low Tidak punya Ya
9 25 .. 35 PNS medium punya Ya
10 25 .. 35 swasta high punya Ya
11 > 35 pengusaha medium Tidak punya Ya
12 <= 25 PNS low Tidak punya tidak

 

Terdapat 2 class dari klasifikasi yang dibentuk, yaitu :

  • C1 (Class 1) = menikah = ya = 7 record
  • C2 (Class 2) = menikah = tidak= = 5 record
  • Total = 12 record

maka:

  • P (C1) = 7/12 = 0,583
  • P (C2) = 5/12 = 0,416

Pertanyaan:

  • Data X = (usia = “25 .. 35”, pekerjaan = “pengusaha”, pendapatan = “high”, rumah = “tidak punya”)
  • Menikah atau tidak ?

Penyelesaian:

  • Hitung P(X|Ci), untuk i=1 dan 2
  • P(usia = “<=25” | menikah = “ya”) = 1/7 = 0,143
  • P(usia = “<=25” | menikah = “tidak”) = 3/5 = 0,6
  • P(usia = “25 .. 35” | menikah = “ya”) = 4/7 = 0,571
  • P(usia = “25 .. 35” | menikah = “tidak”) = 0/5 = 0
  • P(usia = “>35” | menikah = “ya”) = 2/7 = 0,286
  • P(usia = “>35” | menikah = “tidak”) = 2/5 = 0,4
  • P(pekerjaan = “swasta” | menikah = “ya”) = 4/7 = 0,571
  • P(pekerjaan = “swasta” | menikah = “tidak”) = 1/5 = 0,2
  • P(pekerjaan = “PNS” | menikah = “ya”) = 1/7 = 0,143
  • P(pekerjaan = “PNS” | menikah = “tidak”) = 3/5 = 0,6
  • P(pekerjaan = “pengusaha” | menikah = “ya”) = 2/7 = 0,286
  • P(pekerjaan = “pengusaha” | menikah = “tidak”) = 1/5 = 0,2
  • P(pendapatan = “low” | menikah = “ya”) = 1/7 = 0,143
  • P(pendapatan = “low” | menikah = “tidak”) = 2/5 = 0,4
  • P(pendapatan = “medium” | menikah = “ya”) = 3/7 = 0,428
  • P(pendapatan = “medium” | menikah = “tidak”) = 2/5 = 0,4
  • P(pendapatan = “high” | menikah = “ya”) = 3/7 = 0,428
  • P(pendapatan = “high” | menikah = “tidak”) = 1/5 = 0,2
  • P(rumah= “punya” | menikah = “ya”) = 4/7 = 0,571
  • P(rumah = “punya” | menikah = “tidak”) = 2/5 = 0,4
  • P(rumah = “tidak punya” | menikah = “ya”) = 3/7 = 0,428
  • P(rumah = “tidak punya” | menikah = “tidak”) = 3/5 = 0,6
P value menikah Tidak menikah
usia <=25 0,143 0,6
25 .. 35 0,571 0
>35 0,286 0,4
pekerjaan Swasta 0,571 0,2
PNS 0,143 0,6
Pengusaha 0,286 0,2
pendapatan Low 0,143 0,4
Medium 0,428 0,4
High 0,428 0,2
rumah punya 0,571 0,4
Tidak punya 0,428 0,6

Hasil

  • Data X = (usia = “25 .. 35”, pekerjaan = “pengusaha”, pendapatan = “high”, rumah = “tidak punya”)
  • Menikah atau tidak ?
  • Dari data X diatas maka hasilnya adalah:

P(X|menikah= “ya”) = 0,571*0,286*0,428*0,428 = 0,029915

P(X|menikah= “tidak menikah”) = 0*0,2*0,2*0,6 = 0

Maka

  • P(X|menikah= “ya”)*P(C1) = 0,029915*0,583 = 0,01744
  • P(X|menikah= “tidak menikah”)*P(C1) = 0*0,416 = 0
  • Kesimpulan:

Nilai “ya” lebih besar dari nilai “tidak menikah” maka clss dari data X tersebut adalah “ya”