Klasifikasi Penyakit Diabetes Menggunakan Algoritm
Klasifikasi Penyakit Diabetes Menggunakan Algoritm
Klasifikasi Penyakit Diabetes Menggunakan Algoritm
Abstrak
Penyakit diabetes merupakan salah satu penyakit kronis yang prevalensinya terus meningkat di seluruh
dunia. Diagnosis dini menjadi permasalahan utama dalam pengelolaan penyakit diabetes di mana
banyak pasien tidak menyadari penyakit mereka sampai gejala serius muncul. Klasifikasi penyakit
diabetes membantu mengidentifikasi diabetes pada tahap awal untuk intervensi yang lebih efektif.
Penelitian ini menggunakan algoritma Decision Tree untuk mengidentifikasi serta mengklasisfikasikan
pasien diabetes. Dataset bersal dari kumpulan data klinis pasien diabetes dan membangun model
klasifikasi menggunakan algoritma Decision Tree. Model yang dihasilkan mampu mengidentifikasi
pasien diabetes dengan tingkat akurasi yang tinggi berdasarkan data klinis yang terkumpul. Hasil
evaluasi model menunjukkan presisi sebesar 0.78, recall sebesar 0.45, dan F1-score sebesar 0.57
untuk kelas positif diabetes. Namun, hasil evaluasi juga menunjukkan adanya batasan pada kinerja
model dalam mengklasifikasikan pasien diabetes dengan recall yang lebih rendah. Oleh karena itu,
penelitian ini memberikan landasan untuk pengembangan lebih lanjut guna meningkatkan performa
model klasifikasi ini, seperti dengan mempertimbangkan atribut klinis lainnya yang relevan.
Abstract
Diabetes is a chronic disease whose prevalence continues to increase worldwide. Early diagnosis is a
major problem in managing diabetes where many patients are not aware of their disease until serious
symptoms appear. Diabetes disease classification helps identify diabetes at an early stage for more
effective interventions. This study uses the Decision Tree algorithm to identify and classify diabetes
patients. The dataset comes from a clinical data set of diabetes patients and builds a classification model
using the Decision Tree algorithm. The resulting model is able to identify diabetes patients with a high
degree of accuracy based on the collected clinical data. The results of the model evaluation showed a
precision of 0.78, a recall of 0.45, and an F1-score of 0.57 for the positive diabetes class. However, the
evaluation results also show that there is a limitation on the performance of the model in classifying
diabetic patients with lower recall. Therefore, this study provides a basis for further development to
improve the performance of this classification model, such as by considering other relevant clinical
attributes.
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
JURNAL INFORMATIKA, Vol. 10 No.2 Oktober 2023
ISSN: 2355-6579 | E-ISSN: 2528-2247
http://ejournal.bsi.ac.id/ejurnal/index.php/ji 144
JURNAL INFORMATIKA, Vol. 10 No.2 Oktober 2023
ISSN: 2355-6579 | E-ISSN: 2528-2247
http://ejournal.bsi.ac.id/ejurnal/index.php/ji 145
JURNAL INFORMATIKA, Vol. 10 No.2 Oktober 2023
ISSN: 2355-6579 | E-ISSN: 2528-2247
untuk memberikan gambaran yang lebih Glucose Blood Skin BMI Outcome
komprehensif tentang kinerja model. Pressure Thic
Selain evaluasi, validasi juga dilakukan kness
untuk memastikan bahwa model yang telah 5 103 30 38 43.3 0
6 115 70 30 34.6 1
dibentuk dapat menggeneralisasi dengan baik
7 126 88 41 39.3 0
pada data yang tidak digunakan dalam 8 99 84 0 35.4 0
pembentukan model. Validasi dilakukan untuk 9 196 90 0 39.8 1
memeriksa apakah model hanya "menghafal" 1 119 80 35 29 1
data yang digunakan dalam pembentukan atau 0
mampu mengekstrapolasi dan menerapkan
pola yang ditemukan pada data baru. Dalam penelitian ini, terdapat transformasi kuantil
Validasi dilakukan dengan meng- yang dapat digunakan sebagai teknik yang
gunakan teknik seperti validasi silang (cross- bermanfaat untuk mengubah distribusi data
validation) atau validasi pada set data uji yang menjadi lebih merata. Dengan mengaplikasikan
terpisah. Dengan melakukan validasi, penelitian transformasi kuantil pada variabel yang tidak
ini dapat memastikan bahwa model klasifikasi memiliki distribusi yang merata atau teratur,
yang dikembangkan memiliki tingkat keandalan sehingga dapat mengubah nilai dalam rentang
yang tinggi dan dapat digunakan untuk antara 0 dan 1. Hal ini membantu menyederhana-
memprediksi penyakit diabetes pada data yang kan data dan membuatnya lebih mudah
belum pernah dilihat sebelumnya. dipahami. Transformasi kuantil digunakan untuk
memperbaiki distribusi atribut klinis yang
digunakan dalam pengembangan model
klasifikasi diabetes.
Tabel 1. Dataset
Glucose Blood Skin BMI Outcome
Pressure Thic
kness
0 189 60 23 30.1 1
1 166 72 19 25.8 1
2 100 0 0 30 1
3 118 84 47 45.8 1
4 107 74 0 29.6 1
Gambar 7. Hasil Seleksi Fitur
http://ejournal.bsi.ac.id/ejurnal/index.php/ji 146
JURNAL INFORMATIKA, Vol. 10 No.2 Oktober 2023
ISSN: 2355-6579 | E-ISSN: 2528-2247
Pada gambar 5 hasil seleksi fitur dengan nilai prediksi, terdapat 15 data yang
membantu untuk mengetahui hubungan antara sesuai. Dari 15 data tersebut, 6 data
dua besaran. Hal ini menunjukkan ukuran diklasifikasikan sebagai diabetes dan 9 data
kekuatan hubungan antara dua variabel. Nilai diklasifikasikan sebagai non-diabetes. Hal ini
Koefisien Korelasi Pearson dapat berkisar menunjukkan bahwa pohon keputusan berhasil
antara -1 hingga +1. 1 berarti sangat berkorelasi memprediksi dengan akurasi yang relatif baik.
dan 0 berarti tidak ada korelasi.
Tabel 2. Hasil Klasifikasi
Hasil Klasifikasi
Diabetes 6
Non Diabetes 9
http://ejournal.bsi.ac.id/ejurnal/index.php/ji 147
JURNAL INFORMATIKA, Vol. 10 No.2 Oktober 2023
ISSN: 2355-6579 | E-ISSN: 2528-2247
http://ejournal.bsi.ac.id/ejurnal/index.php/ji 148
JURNAL INFORMATIKA, Vol. 10 No.2 Oktober 2023
ISSN: 2355-6579 | E-ISSN: 2528-2247
Hardianto, D. (2021). Telaah Komprehensif Posonia, A. M., Vigneshwari, S., & Rani, D. J.
Diabetes Melitus: Klasifikasi, Gejala, (2020). Machine learning based diabetes
Diagnosis, Pencegahan, Dan prediction using decision tree J48.
Pengobatan. Jurnal Bioteknologi & Proceedings of the 3rd International
Biosains Indonesia (JBBI), 7(2), 304– Conference on Intelligent Sustainable
317. Systems, ICISS 2020, 498–502.
https://doi.org/10.29122/jbbi.v7i2.4209 https://doi.org/10.1109/ICISS49785.2020.9
Karyadiputra, E., & Setiawan, A. (2022). 316001
Penerapan Data Mining Untuk Prediksi Putri, S., Irawan, E., & Rizky, F. (2021).
Awal Kemungkinan Terindikasi Diabetes. Implementasi Data Mining Untuk Prediksi
Teknosains: Media Informasi Sains Dan Penyakit Diabetes Dengan Algoritma C4.5.
Teknologi, 16(2), 221–232. Januari, 2(1), 39–46.
https://doi.org/10.24252/teknosains.v16i2 Sunanto, N., & Falah, G. (2022). Penerapan
.28257 Algoritma C4.5 Untuk Membuat Model
Lestari, Zulkarnain, & Sijid, S. A. (2021). Prediksi Pasien Yang Mengidap Penyakit
Diabetes Melitus: Review Etiologi, Diabetes. Rabit : Jurnal Teknologi Dan
Patofisiologi, Gejala, Penyebab, Cara Sistem Informasi Univrab, 7(2), 208–216.
Pemeriksaan, Cara Pengobatan dan https://doi.org/10.36341/rabit.v7i2.2435
Cara Pencegahan. UIN Alauddin V.A.R.Barao, R.C.Coata, J.A.Shibli, M.Bertolini,
Makassar, November, 237–241. & J.G.S.Souza. (2022). Klasifikasi Penyakit
http://journal.uin- Diabetes Menggunakan Metode Decision
alauddin.ac.id/index.php/psb Tree Dan Random Forest. Braz Dent J.,
33(1), 1–12.
http://ejournal.bsi.ac.id/ejurnal/index.php/ji 149