Penerapan Metode K-Means dalam Pengelompokan Jumlah Kasus Penderita Covid-19 di Dunia

Muhamad Raihan Ramadhani Isworo, Anya Ningrum Nur’afifah, Kesya Nursyahada, Ananda Azra Razali

Abstract


Penelitian untuk mengelompokkan jumlah kasus COVID-19 di dunia dengan menggunakan metode K-Means Klustering, yaitu teknik dalam data mining yang sangat efektif untuk mendeteksi pola dalam dataset yang besar. Data yang dipergunakan diambil dari situs Worldometers pada 13 Oktober 2024, mencakup 231 negara di seluruh dunia. Untuk menentukan jumlah kluster yang paling tepat, studi ini menerapkan metode Elbow, dengan perhitungan yang didasarkan pada nilai Sum of Squared Errors (SSE). Hasil analisis memperlihatkan penurunan SSE yang paling mencolok dari k=1 ke k=2, serta penurunan signifikan yang berlanjut hingga k=3. Setelah k=3, penurunan SSE mulai melambat, yang menunjukkan bahwa tiga kluster adalah jumlah yang paling tepat untuk pengelompokan ini. Selanjutnya, evaluasi kualitas pengelompokan menggunakan Silhouette Score menghasilkan nilai 0.9186, yang menunjukkan bahwa hasil klustering sangat baik, dengan objek-objek dalam satu kluster memiliki kemiripan yang tinggi dan terpisah dengan jelas dari kluster lain.


References


. Noviyanto, R. (2020). Penerapan data mining dalam mengelompokkan jumlah

kematian penderita COVID-19 berdasarkan negara di benua Asia. Jurnal Teknik

Informatika, 12(2), 45-60.

. World Health Organization (WHO). (2020). COVID-19 Dashboard. Diakses melalui

https://www.who.int

. Tan, P. N., Steinbach, M., & Karpatne, A. (2020). Introduction to Data Mining (3rd

ed.). Boston, MA: Pearson Education.

. Lloyd, S. (1982). Least squares quantization in PCM. IEEE Transactions on

Information Theory, 28(2), 129-137.

. MacQueen, J. (1967). Some methods for classification and analysis of multivariate

observations. In Proceedings of the Fifth Berkeley Symposium on Mathematical

Statistics and Probability (pp. 281-297). Berkeley, CA: University of California

Press.

. Rousseeuw, P. J. (1987). Silhouettes: A graphical aid to the interpretation and

validation of kluster analysis. Journal of Computational and Graphical Statistics,

(1), 53-65


Full Text: PDF


DOI : https://doi.org/10.33005/scan.v19i3.5029

Refbacks

  • There are currently no refbacks.