Penerapan Metode K-Means dalam Pengelompokan Jumlah Kasus Penderita Covid-19 di Dunia
Abstract
Penelitian untuk mengelompokkan jumlah kasus COVID-19 di dunia dengan menggunakan metode K-Means Klustering, yaitu teknik dalam data mining yang sangat efektif untuk mendeteksi pola dalam dataset yang besar. Data yang dipergunakan diambil dari situs Worldometers pada 13 Oktober 2024, mencakup 231 negara di seluruh dunia. Untuk menentukan jumlah kluster yang paling tepat, studi ini menerapkan metode Elbow, dengan perhitungan yang didasarkan pada nilai Sum of Squared Errors (SSE). Hasil analisis memperlihatkan penurunan SSE yang paling mencolok dari k=1 ke k=2, serta penurunan signifikan yang berlanjut hingga k=3. Setelah k=3, penurunan SSE mulai melambat, yang menunjukkan bahwa tiga kluster adalah jumlah yang paling tepat untuk pengelompokan ini. Selanjutnya, evaluasi kualitas pengelompokan menggunakan Silhouette Score menghasilkan nilai 0.9186, yang menunjukkan bahwa hasil klustering sangat baik, dengan objek-objek dalam satu kluster memiliki kemiripan yang tinggi dan terpisah dengan jelas dari kluster lain.
References
. Noviyanto, R. (2020). Penerapan data mining dalam mengelompokkan jumlah
kematian penderita COVID-19 berdasarkan negara di benua Asia. Jurnal Teknik
Informatika, 12(2), 45-60.
. World Health Organization (WHO). (2020). COVID-19 Dashboard. Diakses melalui
https://www.who.int
. Tan, P. N., Steinbach, M., & Karpatne, A. (2020). Introduction to Data Mining (3rd
ed.). Boston, MA: Pearson Education.
. Lloyd, S. (1982). Least squares quantization in PCM. IEEE Transactions on
Information Theory, 28(2), 129-137.
. MacQueen, J. (1967). Some methods for classification and analysis of multivariate
observations. In Proceedings of the Fifth Berkeley Symposium on Mathematical
Statistics and Probability (pp. 281-297). Berkeley, CA: University of California
Press.
. Rousseeuw, P. J. (1987). Silhouettes: A graphical aid to the interpretation and
validation of kluster analysis. Journal of Computational and Graphical Statistics,
(1), 53-65
Full Text: PDF








