IMPLEMENTASI BIG DATA ANALYTICS DALAM KLASIFIKASI KUALITAS UDARA MENGGUNAKAN ALGORITMA GRADIENT-BOOSTED TREE CLASSIFIER PADA PYSPARK

Penulis

  • Muhamad Fuat Asnawi Universitas Sains Al-Qur'an
  • Nur Fitriyanto Universitas Amikom Yogyakarta
  • M. Agoeng Pamoengkas Universitas Amikom Yogyakarta

DOI:

https://doi.org/10.58641/technomedia.v2i1.124

Kata Kunci:

Big Data Analytics, Gradient-Boosted Tree, Kualitas Udara, PySpark

Abstrak

Penelitian ini bertujuan untuk mengklasifikasikan kualitas udara berdasarkan parameter PM1.0, PM2.5, dan PM10 dengan memanfaatkan pendekatan Big Data Analytics menggunakan algoritma Gradient-Boosted Tree Classifier (GBT) yang diimplementasikan pada framework PySpark. Dataset yang digunakan diunduh dari OpenAQ, mencakup periode 14 April 2021 hingga 16 April 2023, dengan total 1.048.154 entri, menunjukkan volume data yang besar dan kompleks. Proses penelitian meliputi pra-pemrosesan data untuk menangani ketidakseimbangan data, pembagian dataset untuk pelatihan dan pengujian, serta tuning hyperparameter menggunakan grid search dan cross-validation untuk mengoptimalkan kinerja model. Dengan memanfaatkan keunggulan PySpark dalam pemrosesan data besar secara paralel, model GBT berhasil mencapai akurasi 98.87%, presisi 99.00%, recall 98.87%, dan F1-Score 98.90%. Penelitian ini menunjukkan bagaimana Big Data Analytics dapat meningkatkan efisiensi dan akurasi dalam klasifikasi kualitas udara, memberikan kontribusi signifikan dalam pengembangan sistem pemantauan real-time yang mendukung mitigasi polusi udara dan pengambilan kebijakan berbasis data.

Diterbitkan

2025-01-31

Cara Mengutip

Muhamad Fuat Asnawi, Nur Fitriyanto, & M. Agoeng Pamoengkas. (2025). IMPLEMENTASI BIG DATA ANALYTICS DALAM KLASIFIKASI KUALITAS UDARA MENGGUNAKAN ALGORITMA GRADIENT-BOOSTED TREE CLASSIFIER PADA PYSPARK. Tekompedia : Jurnal Ilmiah Ilmu Komputer, 2(1), 15–20. https://doi.org/10.58641/technomedia.v2i1.124

Terbitan

Bagian

Articles