IMPLEMENTASI BIG DATA ANALYTICS DALAM KLASIFIKASI KUALITAS UDARA MENGGUNAKAN ALGORITMA GRADIENT-BOOSTED TREE CLASSIFIER PADA PYSPARK

Muhamad Fuat Asnawi; Nur Fitriyanto; M. Agoeng Pamoengkas

doi:10.58641/technomedia.v2i1.124

IMPLEMENTASI BIG DATA ANALYTICS DALAM KLASIFIKASI KUALITAS UDARA MENGGUNAKAN ALGORITMA GRADIENT-BOOSTED TREE CLASSIFIER PADA PYSPARK

Penulis

Muhamad Fuat Asnawi Universitas Sains Al-Qur'an
Nur Fitriyanto Universitas Amikom Yogyakarta
M. Agoeng Pamoengkas Universitas Amikom Yogyakarta

DOI:

https://doi.org/10.58641/technomedia.v2i1.124

Kata Kunci:

Big Data Analytics, Gradient-Boosted Tree, Kualitas Udara, PySpark

Abstrak

Penelitian ini bertujuan untuk mengklasifikasikan kualitas udara berdasarkan parameter PM1.0, PM2.5, dan PM10 dengan memanfaatkan pendekatan Big Data Analytics menggunakan algoritma Gradient-Boosted Tree Classifier (GBT) yang diimplementasikan pada framework PySpark. Dataset yang digunakan diunduh dari OpenAQ, mencakup periode 14 April 2021 hingga 16 April 2023, dengan total 1.048.154 entri, menunjukkan volume data yang besar dan kompleks. Proses penelitian meliputi pra-pemrosesan data untuk menangani ketidakseimbangan data, pembagian dataset untuk pelatihan dan pengujian, serta tuning hyperparameter menggunakan grid search dan cross-validation untuk mengoptimalkan kinerja model. Dengan memanfaatkan keunggulan PySpark dalam pemrosesan data besar secara paralel, model GBT berhasil mencapai akurasi 98.87%, presisi 99.00%, recall 98.87%, dan F1-Score 98.90%. Penelitian ini menunjukkan bagaimana Big Data Analytics dapat meningkatkan efisiensi dan akurasi dalam klasifikasi kualitas udara, memberikan kontribusi signifikan dalam pengembangan sistem pemantauan real-time yang mendukung mitigasi polusi udara dan pengambilan kebijakan berbasis data.

Unduhan

PDF (English)

Diterbitkan

2025-01-31

Cara Mengutip

Muhamad Fuat Asnawi, Nur Fitriyanto, & M. Agoeng Pamoengkas. (2025). IMPLEMENTASI BIG DATA ANALYTICS DALAM KLASIFIKASI KUALITAS UDARA MENGGUNAKAN ALGORITMA GRADIENT-BOOSTED TREE CLASSIFIER PADA PYSPARK. Tekompedia : Jurnal Ilmiah Ilmu Komputer, 2(1), 15–20. https://doi.org/10.58641/technomedia.v2i1.124

Unduh Sitasi

Terbitan

Vol 2 No 1 (2025): Januari

Bagian

Articles

Lisensi

Artikel ini berlisensi Creative Commons Attribution 4.0 International License.

IMPLEMENTASI BIG DATA ANALYTICS DALAM KLASIFIKASI KUALITAS UDARA MENGGUNAKAN ALGORITMA GRADIENT-BOOSTED TREE CLASSIFIER PADA PYSPARK

Penulis

DOI:

Kata Kunci:

Abstrak

Unduhan

Diterbitkan

Cara Mengutip

Terbitan

Bagian

Lisensi

Artikel paling banyak dibaca berdasarkan penulis yang sama

menu

template

eissn

statistics

member-of

Informasi

Terbitan Terkini

Bahasa