Clustering
Clustering
Clustering
• 2. Ilmu Komputer
• Web mining,analisa database spatial,information
retrieval,textual document collection,dan image
segmentation.
Aplikasi Teknik Clustering
• 3. Medis
• Digunakan dalam mendefinisikan taxonomi dalam bidang
biologi, identifikasi fungsi protein dan gen, diagnosa penyakit
dan penanganannya.
• 4. Astronomy
• Digunakan untuk mengelompokkan bintang dan planet,
menginvestigasi formasi tanah, mengelompokkan wilayah
/kota, digunakan dalam studi tentang sistem pada sungai dan
gunung.
Aplikasi Teknik Clustering
• 5. Sosial
• Digunakan pada analisa pola perilaku,identifikasi hubungan
diantara budaya yang berbeda, pembentukan sejarah evolusi
bahasa, dan studi psikologi criminal.
• 6. Ekonomi
• Penerapan pada pengenalan pola pembelian& karakteristik
konsumen, pengelompokan perusahaan, analisa trend stok.
TIPE-TIPE CLUSTERING
Partitional clustering adalah himpunan obyek data ke
dalam sub-himpunan (cluster) yang tidak overlap,
sehingga setiap obyek data berada dalam tepat satu
cluster.
• K-Means
• K-Medoids
• Hierarchical Clustering
K-MEANS CLUSTERING
• K‐Means clustering adalah metode untuk
mengelompokkan item ke dalam kelompok (dimana k
adalah jumlah kelompok yang diinginkan).
a. Menghitung Euclidean distance dari semua data ke tiap titik pusat pertama
Dengan cara yang sama hitung jarak tiap titik ke titik pusat ke dan kita akan
mendapatkan D21= 4.12, D22=4.27, D23= 1.18, D24= 1.86, D25=1.22, D26=2.62,
D27=2.06
CONTOH SOAL
Iterasi 1
DATA C1 C2
M1 1.41 4.12
M2 1.80 4.27
M3 2.06 1.18
M4 3.94 1.86
M5 4.06 1.22
M6 0.94 2.62
M7 1.12 2.06
{M1, M2, M6, M7} anggota C1 and {M3, M4, M5} anggota C2
CONTOH SOAL
Iterasi 1
Kesimpulan {M1, M2, M6, M7} anggota C1 dan {M3, M4, M5} anggota C2
HIERARCHICAL CLUSTERING
Strategi pengelompokkannya umumnya ada dua jenis, yaitu:
• Agglomerative (Bottom-Up)
• Devisive (Top-Down)
• Jadi kelompok (132) dan (45) digabung untuk menjadi kelompok tunggal dari
lima data, yaitu kelompok (13245) dengan jarak terdekat 4. Berikut
Dendogram Hasil Metode Single Linkage :
Tugas
• Latihan: Gunakan metode k-means untuk mengelompokkan mahasiswa
berdasarkan tinggi & berat badan:
• Clustering yang diharapkan mampu menghasilkan kelompok
mahasiswa yang memenuhi sifat berikut :
• Mahasiswa yang memiliki berat dan tinggi badan yang hampir
sama dikelompokkan tersendiri