Normalisasi Data pada Data Mining

Normalisasi disini bukan normalisasi yang dilakukan pada database. Normalisasi disini merupakan normalisasi pada Data Mining proses penskalaan nilai atribut dari data sehingga bisa jatuh pada range tertentu.
contoh data sebagai berikut:




pada proses normalisasi ini ada beberapa metode yang dapat dipakai seperti

  • Min-Max
  • Z-Score
  • Decimal Scaling
  • Sigmoidal
  • Softmax

Min-Max

Metode Min-Max merupakan metode normalisasi dengan melakukan transformasi
linier terhadap data asli

rumus
newdata = (data-min)*(newmax-newmin)/(max-min)+newmin

newdata= data hasil normalisasi
min = nilai minimum dari data per kolom
max = nilai maximum dari data per kolom
newmin = adalah batas minimum yang kita berikan
newmax = adalah batas maximum yang kita berikan

hasil dari metode Min-Max terhadap data contoh



Z-Score

Metode Z-score merupakan metode normalisasi yang berdasarkan mean (nilai rata-rata) dan standard deviation (deviasi standar) dari data .

rumus
newdata = (data-mean)/std

newdata= data hasil normalisasi
mean = nilai rata-rata dari data per kolom
std = nilai dari standard deviasi

hasil dari metode Z-score



Decimal Scaling

Metode Decimal Scaling merupakan metode normalisasi dengan menggerakkan nilai desimal dari data ke arah yang diinginkan

rumus
newdata = data / 10^i

newdata = data hasil normalisasi
i = adalah nilai scaling yang kita inginkan

hasil dari Decimal Scaling



Sigmoidal

Sigmoidal merupakan metode normalization melakukan normalisasi data secara nonlinier ke dalam range -1 - 1 dengan menggunakan fungsi sigmoid.

rumus
newdata = (1-e^(-x))/(1+ e^(-x))

x = (data-mean )/std
e = nilai eksponensial (2,718281828)

Metode ini sangat berguna pada saat data-data yang ada melibatkan data-data outlier. Data outlier data yang keluar jauh dari jangkauan data lainnya

hasil dari Sigmoidal













Softmax

Softmax merupakan metode normalisasi pengembangan transformasi secara linier. Output range-nya adalah 0-1.

rumus:
newdata = 1/(1+e^(-transfdata))

transfdata = (data-mean)/(x*(std/(2*3.14)))
x = respon linier di deviasi standar(ditentukan oleh user)

Metode ini sangat berguna pada saat data-data yang ada melibatkan data-data outlier.

hasil dari metode Softmax
















untuk sources code dapat dilihat di
http://opensourcefaisal.blogspot.co.id/2016/04/normalisasi-pada-data-mining.html
referensi normalisasi by Ali Ridho Barakhbah


video untuk Demo Normalisasi Data Mining

2 comments

metode decimal scalling dapat darimana kk dan buku apa?
soalnya aku mencari penemu,kelebihan dan juga alasan metode itu digunakan
terimakasih

Reply

Aku dapat dari ppt
Gak tahu juga penemunya siapa

Reply

Posting Komentar