Deteksi Kerusakan Jalan Menggunakan Vision Transformer Berbasis Citra Digital

Penulis

  • Melsa Sentia Asta Universitas Pamulang
  • Jumigih Andrian Universitas Pamulang
  • Dhemes Ichsan Ramadhani Universitas Pamulang
  • Perani Rosyani Universitas Pamulang

Kata Kunci:

Vision Transformer, Klasifikasi Citra, Kerusakan Jalan, Deep Learning, Computer Vision

Abstrak

Kerusakan jalan seperti pothole dan crack merupakan permasalahan infrastruktur yang dapat meningkatkan risiko kecelakaan dan menurunkan kenyamanan pengguna jalan. Metode inspeksi jalan secara konvensional masih bersifat manual, subjektif, dan tidak efisien. Penelitian ini bertujuan untuk mengimplementasikan dan mengevaluasi Vision Transformer (ViT) sebagai metode klasifikasi otomatis kerusakan jalan berbasis citra. Dataset yang digunakan terdiri dari 5.444 citra kondisi jalan yang terbagi ke dalam tiga kelas, yaitu no damage, pothole, dan crack, dengan distribusi data yang tidak seimbang. Seluruh citra diproses melalui tahap preprocessing berupa penyeragaman ukuran menjadi 128×128 piksel dan normalisasi nilai piksel. Model Vision Transformer versi ringan dibangun dan dilatih menggunakan lingkungan Google Colab dengan keterbatasan sumber daya komputasi. Hasil pengujian menunjukkan bahwa model mampu mencapai akurasi sebesar ±89,7% dengan performa terbaik pada kelas no damage dan pothole. Namun, performa pada kelas crack masih relatif rendah akibat keterbatasan jumlah data dan karakteristik visual retakan yang berukuran kecil. Hasil penelitian menunjukkan bahwa Vision Transformer memiliki potensi yang baik sebagai solusi otomatis untuk pemantauan kondisi jalan, meskipun diperlukan pengembangan lebih lanjut untuk meningkatkan performa pada kelas minoritas.

Referensi

Arif, M. F., Nurkholis, A., Laia, S., & Rosyani, P. (2023, Juni). Deteksi kendaraan dengan metode YOLO. Jurnal Artificial Intelligence dan Sistem Penunjang Keputusan, 1(1), 12–20. https://jaispk.org/index.php/jaispk/article/view/15

Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2020). An image is worth 16x16 words: Transformers for image recognition at scale. International Conference on Learning Representations. https://openreview.net/forum?id=YicbFdNTTy

Firmansyah, A., Itsnan, A. F., Apip, A., Mulliya, R. T., & Rosyani, P. (2024, Desember). Sistem absensi mahasiswa menggunakan face recognition dengan algoritma CNN. AI dan SPK Jurnal Artificial Intelligence dan Sistem Penunjang Keputusan, 1(4), 45–56. https://doi.org/10.47065/aispk.v1i4.1234

Huyan, J., Li, W., Tighe, S., Xu, Z., & Zhai, J. (2020). CrackU-Net: A novel deep convolutional neural network for pixelwise pavement crack detection. Structural Control and Health Monitoring, 27(8), e2551. https://doi.org/10.1002/stc.2551

Jonathan, M., Hafidz, M. T., Apriyanti, N. A., Husaini, Z., & Rosyani, P. (2023, Juni). Mendeteksi plat nomor kendaraan dengan metode YOLO (you only look once) dan single shot detector (SSD). AI dan SPK Jurnal Artificial Intelligence dan Sistem Penunjang Keputusan, 1(1), 67–75.

Khan, S., Naseer, M., Hayat, M., Zamir, S. W., Khan, F. S., & Shah, M. (2021, September). Transformers in vision: A survey. ACM Computing Surveys, 54(10s), Article 200. https://doi.org/10.1145/3505244

Li, S., Zhao, X., & Zhou, G. (2022). Automatic pavement crack detection by multi-scale image fusion. IEEE Transactions on Intelligent Transportation Systems, 23(10), 18189–18201. https://doi.org/10.1109/TITS.2021.3127639

Liu, Z., Lin, Y., Cao, Y., Hu, H., Wei, Y., Zhang, Z., Lin, S., & Guo, B. (2021). Swin Transformer: Hierarchical vision transformer using shifted windows. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 10012–10022. https://doi.org/10.1109/ICCV48922.2021.00986

ProgrammerRdai. (2025). Road Issues Detection Dataset [Data set]. Kaggle. https://www.kaggle.com/datasets/programmerrdai/road-issues-detection-dataset

Saprudin, Rosyani, P., & Amalia, R. (2021). Klasifikasi citra menggunakan metode random forest dan sequential minimal optimization (SMO). JUSTIN (Jurnal Sistem dan Teknologi Informasi), 9(2), 132–134. https://jurnal.stmik-mi.ac.id/index.php/jstmi/article/view/410

Unduhan

Diterbitkan

2025-12-16

Cara Mengutip

Melsa Sentia Asta, Jumigih Andrian, Dhemes Ichsan Ramadhani, & Perani Rosyani. (2025). Deteksi Kerusakan Jalan Menggunakan Vision Transformer Berbasis Citra Digital . BINER : Jurnal Ilmu Komputer, Teknik Dan Multimedia, 3(4), 426–434. Diambil dari https://journal.mediapublikasi.id/index.php/Biner/article/view/5817