Prediksi Diagnosa Penyakit Diabetes Menggunakan Algoritma Decision Tree Berdasarkan Indikator Kesehatan Tubuh
Keywords:
Algoritma C4.5, Dataset Pima Indians, Decision Tree, Klasifikasi Medis, Machine Learning, Prediksi DiabetesAbstract
Meningkatnya jumlah penderita diabetes mellitus secara global telah menimbulkan urgensi yang nyata terhadap ketersediaan sistem deteksi dini yang akurat, terjangkau, dan dapat diinterpretasikan secara klinis oleh tenaga medis. Penelitian ini bertujuan mengeksplorasi penerapan algoritma Decision Tree varian C4.5 dalam pembangunan model prediksi diagnosis diabetes yang bersumber dari data klinis secara otomatis. Sebagai dataset, digunakan Pima Indians Diabetes yang diperoleh dari UCI Machine Learning Repository, berisikan 768 rekaman medis perempuan berketurunan Indian Pima dengan delapan variabel prediktor kesehatan. Seluruh tahapan penelitian meliputi eksplorasi awal data, penanganan nilai tidak valid menggunakan imputasi median, normalisasi Min-Max, konstruksi pohon keputusan, serta evaluasi kinerja model dengan metode 10-fold cross-validation. Pengujian pada data independen menghasilkan akurasi sebesar 77,92%, recall 75,93%, presisi 66,13%, F1-Score 70,69%, dan nilai AUC-ROC 0,823. Variabel glukosa plasma tercatat memberikan kontribusi tertinggi terhadap kepentingan fitur yakni sebesar 38,14%, yang menegaskan posisinya sebagai penanda klinis utama dalam diagnosis diabetes. Temuan ini mengindikasikan bahwa algoritma Decision Tree C4.5 berpotensi dijadikan instrumen skrining awal diabetes pada fasilitas layanan kesehatan tingkat pertama.
References
Abdurrahman, G. (2022). Jurnal Sistem dan Teknologi Informasi Klasifikasi Penyakit Diabetes Melitus Menggunakan Adaboost Classifier. 7(1).
Aditya, M. F., & Pramuntadi, A. (2024). Implementation of Decision Tree Method for Diabetes Mellitus Type 2 Prediction Implementasi Metode Decision Tree pada Prediksi Penyakit Diabetes Melitus Tipe 2. 4(July), 1104–1110.
Ahamed, B. S., Arya, M. S., & V, A. O. N. (2022). Prediction of Type-2 Diabetes Mellitus Disease Using Machine Learning Classifiers and Techniques. 4(May), 1–5.
Chang, V. (2022). Pima Indians diabetes mellitus classification based on machine learning ( ML ) algorithms. Neural Computing and Applications, 0123456789. https://doi.org/10.1007/s00521-022-07049-z
Faisal, M. (2023). Klasifikasi Penyakit Diabetes Menggunakan Algoritma Decision Tree. 10(2). Jurnal Ilmiah Informatika, 10(2), 45–52.
Guan, Y., & Irvine, C. (2023). Research on Diabetes Prediction Model of Pima Indian Females. In 2023 4th International Symposium on Artificial Intelligence for Medicine Science (ISAIMS 2023), October 2022, 2023, Chengdu, China (Vol. 1, Issue 1). Association for Computing Machinery. https://doi.org/10.1145/3644116.3644168
Han, J., Kamber, M., & Pei, J. (2011). Data Mining: Concepts and Techniques (Edisi ke-3). Morgan Kaufmann Publishers. ISBN 978-0-12-381479-1. https://www.sciencedirect.com/book/9780123814791/data-mining-concepts-and-techniques
Hasan, R., Dattana, V., & Mahmood, S. (2025). Towards Transparent Diabetes Prediction : Combining AutoML and Explainable AI for Improved Clinical Insights. Information, 16(1), 7.
IDF Diabetes Atlas. (2021). IDF Diabetes Atlas, 10th Edition. International Diabetes Federation. https://www.diabetesatlas.org
Karyadiputra, E., & Setiawan, A. (2022). Penerapan data mining untuk prediksi awal kemungkinan terindikasi diabetes. 221–232.
Knowler, W. C., Barrett-connor, E., Fowler, S. E., & Hamman, R. F. (2002). Reduction in the incidence of type 2 diabetes with lifestyle intervention or metformin. New England Journal of Medicine, 346(6), 393-403
Oktaviana, A., Wijaya, D. P., Pramuntadi, A., & Heksaputra, D. (2024). Prediction of Type 2 Diabetes Mellitus Using The K-Nearest Neighbor ( K-NN ) Algorithm Prediksi Penyakit Diabetes Melitus Tipe 2 Menggunakan Algoritma K-Nearest Neighbor ( K-NN ). 4(July), 812–818.
Pedregosa, F., Weiss, R., & Brucher, M. (2011). Scikit-learn : Machine Learning in Python. 12, 2825–2830. http://jmlr.org/papers/v12/pedregosa11a.html
Ross, J., Morgan, Q., & Publishers, K. (1994). Book Review : C4 . 5 : Programs for Machine Learning. 240, 235–240.
Setiani, H., & Arridho, M. N. (2025). Early Detection of Type 2 Diabetes Using C4 . 5 Decision Tree Algorithm on Clinical Health Records. 9(4), 1663–1669. https://doi.org/10.30871/jaic.v9i4.10190
Smith, J. W., Everhart, J. E., Dickson, W. C., Knowler, W. C., & Johannes, R. S. (1988). Using the ADAP Learning Algorithm to Forecast the Onset of Diabetes Mellitus. Dalam Proceedings of the Annual Symposium on Computer Application in Medical Care (hal. 261-265).
Tigga, N. P., & Garg, S. (2020). ScienceDirect ScienceDirect Prediction of Type 2 Diabetes using Machine Learning Prediction of Type 2 Diabetes using Machine Learning Classification Methods Classification Methods. PROCS, 167(2019), 706-716. https://doi.org/10.1016/j.procs.2020.03.336
UCI Machine Learning Repository. (1988). Pima Indians Diabetes Database. National Institute of Diabetes and Digestive and Kidney Diseases (NIDDK). https://archive.ics.uci.edu/ml/datasets/diabetes
World Health Organization (WHO). (2023). Diabetes - Fact Sheet. World Health Organization. https://www.who.int/news-room/fact sheets/detail/diabetes












