Tugas Fuzzy C-Means

Unduh sebagai pptx, pdf, atau txt
Unduh sebagai pptx, pdf, atau txt
Anda di halaman 1dari 10

PENAMBANGAN DATA

Fuzzy C Means

Dosen Pengampu : Pak Iwan Tri Riyadi Yanto

PRESENTED BY Maria Tigris Nainggolan


Fuzzy C-Means
• Fuzzy clustering adalah salah satu teknik untuk menentukan cluster
optimal dalam suatu ruang vektor yang didasarkan pada bentuk
normal Euclidian untuk jarak antar vektor.
• Fuzzy C-Means (FCM) adalah suatu teknik pengclusteran data yang
mana keberadaan tiap-tiap titik data dalam suatu cluster
ditentukan oleh derajat keanggotaan.
• Output dari FCM bukan merupakan fuzzy inference system, namun
merupakan deretan pusat cluster dan beberapa derajat
keanggotaan untuk tiap-tiap titik data. Informasi ini dapat
digunakan untuk membangun suatu fuzzy inference system.
• Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun
1981.
• Fuzzy c-means clustering merupakan jenis clustering yang setiap titik datanya dapat dimiliki
lebih dari satu cluster .

• Hal ini mirip dengan algoritma k-means, namun dengan perbedaan utama pada fuzzy c-
means, setiap titik data dapat memiliki keanggotaan pada beberapa cluster.

• Dalam pengelompokan fuzzy, setiap titik data dapat memiliki keanggotaan pada beberapa
kluster. Dengan melonggarkan definisi koefisien keanggotaan dari 1 atau 0, nilai-nilai ini
dapat berkisar dari nilai apa pun dari 1 hingga 0[2]. Pusat massa suatu klaster adalah rata-
rata semua titik, yang diberi bobot berdasarkan derajat kepemilikannya terhadap klaster
tersebut
 Konsep dasar FCM, pertama kali adalah menentukan
pusat cluster, yang akan menandai lokasi rata-rata untuk
tiap-tiap cluster.
 Pada kondisi awal, pusat cluster ini masih belum akurat.
Tiap-tiap titik data memiliki derajat keanggotaan untuk
tiap-tiap cluster.
 Dengan cara memperbaiki pusat cluster dan derajat
keanggotaan tiap-tiap titik data secara berulang, maka
akan dapat dilihat bahwa pusat cluster akan bergerak
menuju lokasi yang tepat.
 Perulangan ini didasarkan pada minimisasi fungsi
obyektif yang menggambarkan jarak dari titik data yang
diberikan ke pusat cluster yang terbobot oleh derajat
keanggotaan titik data tersebut.
ALGORITMA FUZZY C-MEANS
Menentukan Jumlah
Cluster (c), weighted Membangkitkan
Input Data yang exponent (w=2),
akan di Cluster,
bilangan random
maksimum iterasi sebagai elemen
berupa matriks (100), error terkecil (𝜀
berukuran n x m matriks partisi awal
= 10-6 ), fungsi objektif
awal (P0=0), dan U, berukuran n x c
iterasi awal (t=1)

Menentukan kriteria Menghitung derajat


penghentian iterasi, keanggotaan setiap Menghitung centroid dari
apabila 𝑈 𝑙 − 𝑈 (𝑙−1) data pada setiap masing – masing
kelompok menggunakan
< 𝜀 maka proses cluster dengan persamaan
berhenti jangkauan nilai 0-1
Prinsip-prinsip Fuzzy C-Means :
•Pemilihan Jumlah Cluster (K): Langkah pertama dalam menggunakan FCM adalah menentukan jumlah
cluster (K) yang diinginkan untuk data Anda. Hal ini dilakukan sebelum memulai proses clustering.

•Inisialisasi Cluster: Inisialisasi cluster awal dilakukan dengan cara menghasilkan K centroid awal untuk
setiap cluster. Inisialisasi dapat dilakukan secara acak atau dengan metode lain, seperti menggunakan K-
Means konvensional.

•Perhitungan Derajat Keanggotaan: FCM menghitung derajat keanggotaan setiap data point dalam setiap
cluster. Derajat keanggotaan ini berada dalam rentang antara 0 dan 1, di mana 0 berarti data point tidak
termasuk dalam cluster tersebut, dan 1 berarti data point sepenuhnya termasuk dalam cluster tersebut.
Perhitungan derajat keanggotaan menggunakan persamaan berikut:
Di mana:

•μijμij​adalah derajat keanggotaan data point ii dalam cluster jj.


•dijdij​adalah jarak antara data point ii dan centroid cluster jj.
•dikdik​adalah jarak antara data point ii dan centroid cluster kk.
•mm adalah parameter fuzziness yang biasanya diatur antara 1 dan 2.
Item 2
10.7%

Item 5

• Perhitungan Centroid Baru: Setelah derajat keanggotaan dihitung, centroid baru untuk 28.6%

setiap cluster dihitung dengan memperhitungkan derajat keanggotaan data point.


Perhitungan ini menggunakan persamaan berikut:

Item 3
33.9%

Di mana:
 cjcj​adalah centroid baru dari cluster jj.
 xixi​adalah data point ii.
 nn adalah jumlah data points dalam dataset. Item 4
26.8%
 mm adalah parameter fuzziness.

• Iterasi: Langkah 3 dan 4 diulang sampai kondisi berhenti terpenuhi. Kondisi berhenti bisa
berupa jumlah iterasi maksimum yang telah dicapai atau ketika perubahan dalam derajat
keanggotaan atau posisi centroid sangat kecil.
• Hasil Clustering: Hasil akhir dari FCM adalah penempatan data point ke dalam cluster
bersamaan dengan derajat keanggotaan setiap data point dalam cluster-cluster tersebut.

Back to Agenda
MetodeFuzzy
Kelebihan Proteksi Data
C-Means

1 Fleksibilitas dalam Klastering

2 Robust Terhadap Noise

Mampu Menangani Cluster Yang Beririsan


3
Kelemahan Fuzzy C-Means

1.Sensitif Terhadap Pemilihan Parameter


2. Komputasi yang Intensif:
3. Inisialisasi Cluster Awal yang Penting.
4. Tidak Terlalu Interpretable
5. Perlu Pengetahuan Domain
Sekian
dan
Terimakasih

Anda mungkin juga menyukai