ANALISIS PENGELOMPOKAN PROVINSI DI INDONESIA BERDASARKAN JUMLAH DESA/KELURAHAN MENURUT JENIS PENCEMARAN LINGKUNGAN HIDUP TAHUN 2024 MENGGUNAKAN PCA DAN K-MEANS CLUSTERING
Kata Kunci:
K-MEANS CLUSTERING, PCA, Pencemaran Lingkungan., Analisis Spasial, IndonesiaAbstrak
Pencemaran lingkungan merupakan isu penting di Indonesia karena berdampak pada kesehatan masyarakat dan keberlanjutan ekosistem. Variasi tingkat pencemaran antarprovinsi menunjukkan perlunya analisis yang mampu menggambarkan pola spasial secara komprehensif. Penelitian ini bertujuan mengelompokkan 38 provinsi di Indonesia berdasarkan jumlah desa/kelurahan menurut jenis pencemaran lingkungan, meliputi pencemaran air, tanah, udara, serta wilayah yang tidak mengalami pencemaran pada tahun 2024. Data diperoleh dari publikasi resmi Badan Pusat Statistik (BPS) dan dianalisis menggunakan kombinasi Principal Component Analysis (PCA) sebagai tahap reduksi dimensi serta K-Means Clustering sebagai metode pengelompokan. Tahap awal dilakukan statistika deskriptif, transformasi logaritmik, dan standarisasi data untuk meningkatkan kualitas analisis. PCA menghasilkan dua komponen utama yang mampu menjelaskan 89,41% variasi total data. Penentuan jumlah klaster optimal menggunakan metode Elbow dan Silhouette menunjukkan bahwa dua klaster memberikan struktur pengelompokan yang paling memadai dibandingkan alternatif jumlah klaster lainnya (Silhouette = 0,40). Hasil klasterisasi mengidentifikasi dua kelompok utama, yaitu klaster dengan tingkat pencemaran tinggi yang didominasi provinsi di wilayah barat Indonesia, serta klaster pencemaran rendah yang banyak berada di wilayah timur. Temuan ini memberikan gambaran deskriptif berbasis wilayah mengenai distribusi pencemaran lingkungan antarprovinsi di Indonesia dan dapat menjadi dasar bagi pemerintah dalam merumuskan kebijakan pengendalian lingkungan yang lebih tepat sasaran, khususnya dalam pengelolaan limbah industri, transportasi, dan konservasi sumber daya alam.

