Decision Tree ( Konsep Data Mining )

Decision Tree  pada tabel ” Play Tennis “

play tennis

pertama kita mencari entropi dengan rumus :

rumusentropi

S : himpunan (dataset) kasus

K : banyak partisi S

Pj : probabilitas yang didapat dari sum (ya) dibagi total kasus

 

entropi

kemudian mencari gain dari setiap attribut

 

rumusgain

  1. S : ruang (data) sample yang digunakan untuk training.
  2. A : atribut.
  3. |Si| : jumlah sample untuk nilai V.
  4. |S| : jumlah seluruh sample data.
  5. Entropi(Si) : entropy untuk sample-sample yang memiliki nilai i

gain

Cara membuat Decision Tree:

  • Cari nilai gain tertinggi dari setiap atribut yang ada ,maka attribute tersebut menjadi root pada iterasi pertama.
  • Jika entropi pada nilai attribute tersebut adalah 0 ,maka nilai tersebut merupakan Sedangkan nilai lainnya akan digunakan untuk iterasi selanjutnya..
  • Gunakan nilai attribute yang bukan Leaf tersebut sebagai pivot , untuk dicari entropy dan gain pada iterasi selanjutnya.
  • Lakukan langkah tersebut sampai nilai entropy pada semua nilai attribute = 1.

tree1

tabtree1

gain2

tree2

tabtree2

tabtree2a

tree3

 

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout /  Ubah )

Foto Google

You are commenting using your Google account. Logout /  Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout /  Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout /  Ubah )

Connecting to %s