Analisis Perbandingan Algoritma XGBoost Dan Algoritma Random Forest Untuk Klasifikasi Data Kesehatan Mental
Keywords:
Kesehatan Mental, Extreme Gradient Boost, Random ForestAbstract
Kesehatan mental merupakan sebuah perhatian utama dalam upaya meningkatkan kesejahteraan secara keseluruhan. Permasalahan kesehatan mental ini menjadi sesuatu yang tidak bisa diabaikan begitu saja dan perlu ditangani lebih lanjut. Namun, dalam dunia nyata masih banyak masyarakat yang belum menyadari hal tersebut. Oleh karena itu, penelitian ini dilakukan dengan menggunakan sebuah algoritma untuk klasifikasi kesehatan mental menggunakan perbandingan 2 algoritma yaitu Extreme Gradient Boost dan Random Forest dengan dataset yang diambil kaggle dengan nama mental health dataset.csv berdasarkan beberapa fitur yaitu Jenis Kelamin, Negara, Pekerjaan, Pengobatan, Stres yang Bertambah, Perubahan Kebiasaan, Riwayat Kesehatan Mental, Perubahan Mood, Wawancara Kesehatan Mental, dan Pilihan Perawatan. Metode penelitian dilakukan dengan pemeriksaan data dengan melakukan analisi pada dataset serta membagi data menjadi data training dan data test. Hasil penelitian pada algoritma Extreme Gradient Boost memiliki rata-rata nilai akurasi, presisi, recall, dan f1-score dalam 30 kali percobaan sebesar 99.82% sedangkan algoritma Random Forest memiliki rata-rata nilai akurasi, presisi, recall, dan f1-score dalam 30 kali percobaan sebesar 99.04%.
References
Andriansyah, D.-, & Eka Wulansari Fridayanthie. (2023). Optimization of Support Vector Machine and XGBoost Methods Using Feature Selection to Improve Classification Performance. JOURNAL OF INFORMATICS AND TELECOMMUNICATION ENGINEERING, 6(2), 484–493. https://doi.org/10.31289/jite.v6i2.8373
Dahouda, M. K., & Joe, I. (2021). A Deep-Learned Embedding Technique for Categorical Features Encoding. IEEE Access, 9, 114381–114391. https://doi.org/10.1109/ACCESS.2021.3104357
Data Collection and Normalization. (2023). In Reverse Osmosis 3rd Edition (pp. 419–429). Wiley. https://doi.org/10.1002/9781119725183.ch12
Doctor, K., Mao, T., & Mhaskar, H. (2024). Encoding of data sets and algorithms. Applied Numerical Mathematics, 200, 209–235. https://doi.org/10.1016/j.apnum.2023.07.013
Givari, M. R., Sulaeman, M. R., & Umaidah, Y. (2022). Perbandingan Algoritma SVM, Random Forest Dan XGBoost Untuk Penentuan Persetujuan Pengajuan Kredit. NUANSA INFORMATIKA, 16(1), 141–149. https://doi.org/10.25134/nuansa.v16i1.5406
Jan Melvin Ayu Soraya Dachi, & Pardomuan Sitompul. (2023). Analisis Perbandingan Algoritma XGBoost dan Algoritma Random Forest Ensemble Learning pada Klasifikasi Keputusan Kredit. JURNAL RISET RUMPUN MATEMATIKA DAN ILMU PENGETAHUAN ALAM, 2(2), 87–103. https://doi.org/10.55606/jurrimipa.v2i2.1470
Mahmuda, S. (2024). Implementasi Metode Random Forest pada Kategori Konten Kanal Youtube. JURNAL JENDELA MATEMATIKA, 2(01), 21–31. https://doi.org/10.57008/jjm.v2i01.633
Moore, R. C., Ellis, D. P. W., Fonseca, E., Hershey, S., Jansen, A., & Plakal, M. (2023). Dataset Balancing Can Hurt Model Performance. ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 1–5. https://doi.org/10.1109/ICASSP49357.2023.10095255
Potyka, N., Yin, X., & Toni, F. (2022). Explaining Random Forests using Bipolar Argumentation and Markov Networks (Technical Report). http://arxiv.org/abs/2211.11699
Prakash, A., Thangaraj, J., Roy, S., Srivastav, S., & Mishra, J. K. (2023). Model-Aware XGBoost Method Towards Optimum Performance of Flexible Distributed Raman Amplifier. IEEE Photonics Journal, 15(4), 1–10. https://doi.org/10.1109/JPHOT.2023.3286272
Rosta Br Sebayang, E., Herry Chrisnanto, Y., Jenderal Achmad Yani Cimahi, U., Terusan Jend Sudirman, J., Selatan, C., & Barat, J. (2023). Klasifikasi Data Kesehatan Mental di Industri Teknologi Menggunakan Algoritma Random Forest. IJESPG Journal, 1(3). http://ijespgjournal.org