K-Means Contoh Soal
Using K-means algorithm find the best groupings and means of two clusters of the 2D data below. Show all your work, assumptions, and regulations. M1 = (2, 5.0), M2 = (2, 5.5), M3 = (5, 3.5), M4 = (6.5, 2.2), M5 = (7, 3.3), M6 = (3.5, 4.8), M7 = (4, 4.5)
Jawab
Gambar 1. Plot dari semua data
Asumsi:
- Semua data akan dikelompokkan ke dalam dua kelas
- Center points of both clusters are C1(3,4), C2(6,4)
Iterasi 1
a. Menghitung Euclidean distance dari semua date ke tiap titik pusat pertama
Dengan cara yang sama hitung jara tiap titik ke titik pusat ke dan kita akan mendapatkan D21 = 4.12, D22=4.27, D23= 1.18, D24= 1.86, D25=1.22, D26=2.62, D27=2.06
b. Dari penghitungan Euclidean distance, kita dapat membandingkan: M1 M2 M3 M4 M5 M6 M7
jarak ke C1 1.41 1.80 2.06 3.94 4.06 0.94 1.12
C2 4.12 4.27 1.18 1.86 1.22 2.62 2.06
{M1, M2, M6, M7} anggota C1 and {M3, M4, M5} anggota C2
c. Hitung titik pusat baru
Iterasi ke 2
a. Hitung Euclidean distance dari tiap data ke titik pusat yang baru Dengan cara yang sama dengan iterasi pertama kita akan mendapatkan perbandingan sebagai berikut:
M1 M2 M3 M4 M5 M6 M7
Jadark ke C1 0.76 0.96 2.65 4.62 4.54 0.76 1.31
C2 4.62 4.86 1.27 0.86 0.88 3.22 2.63
b. Dari perbandingan tersebut kira tahu bahwa {M1, M2, M6, M7} anggota C1 dan {M3, M4, M5} anggota C2
c. Karena anggota kelompok tidak ada yang berubah maka titik pusat pun tidak akan berubah.
Kesimpulan
M1, M2, M6, M7} anggota C1 dan {M3, M4, M5} anggota C2


