Rumus Algoritma K-Means
Rumus umum untuk algoritma k-means adalah sebagai berikut:
Rumus umum untuk algoritma k-means adalah sebagai berikut:
- Pilih k titik pusat secara acak dari dataset sebagai pusat awal kelompok.
- Hitung jarak antara setiap titik dalam dataset dengan k pusat kelompok menggunakan rumus jarak Euclidean (atau rumus jarak Manhattan atau rumus jarak Minkowski jika diperlukan).
- Kelompokkan setiap titik ke dalam kelompok dengan pusat kelompok terdekat.
- Hitung ulang pusat kelompok dari setiap kelompok dengan menggunakan rata-rata aritmatik dari semua titik dalam kelompok.
- Ulangi langkah 2-4 hingga konvergen.
Rumus jarak Euclidean untuk menghitung jarak antara dua titik dalam koordinat n-dimensi adalah sebagai berikut:
di mana x dan y adalah dua titik dalam koordinat n-dimensi dan n adalah jumlah dimensi.
Rumus jarak Manhattan untuk menghitung jarak antara dua titik dalam koordinat n-dimensi adalah sebagai berikut:
di mana x dan y adalah dua titik dalam koordinat n-dimensi dan n adalah jumlah dimensi.
Rumus jarak Minkowski untuk menghitung jarak antara dua titik dalam koordinat n-dimensi adalah sebagai berikut:
di mana x dan y adalah dua titik dalam koordinat n-dimensi, n adalah jumlah dimensi, dan p adalah parameter yang mengontrol kekuatan jarak. Jika p = 1, maka rumus ini menjadi rumus jarak Manhattan. Jika p = 2, maka rumus ini menjadi rumus jarak Euclidean.