Perbandingan mtode K-Nearest Neighbors (K-NN) dan regresi logistik biner dalam memprediksi kanker
DOI:
https://doi.org/10.54957/ijhs.v5i2.1456Kata Kunci:
Kanker, K-Nearest Neighbors, Prediksi, Regresi Logistik BinerAbstrak
Latar Belakang: Kanker merupakan salah satu penyakit yang memiliki tingkat kematian tinggi, sehingga dibutuhkan metode klasifikasi yang akurat untuk mendukung proses diagnosis. Penelitian ini membandingkan performa metode K-Nearest Neighbors (KNN) dan Regresi Logistik Biner dalam mengklasifikasikan kanker sebagai ganas atau jinak. Metode: Penelitian ini menggunakan dataset sekunder dari Kaggle yang terdiri dari 569 data pasien kanker dengan 11 variabel independen yang mencakup karakteristik tumor. Model dikembangkan dengan menggunakan normalisasi data, pembagian data training dan testing, serta teknik K-Fold Cross Validation untuk optimasi parameter K dalam KNN. Evaluasi model dilakukan berdasarkan akurasi, presisi, recall, serta uji McNemar dan ANOVA untuk menguji signifikansi perbedaan performa model. Hasil: Model KNN dengan K=13 menunjukkan akurasi 95,58%, presisi 95,83%, dan recall 97,18%, sementara Regresi Logistik Biner memiliki akurasi 94,69%, presisi 92,86%, dan recall 92,86%. Hasil uji McNemar menunjukkan bahwa tidak terdapat perbedaan signifikan antara kedua model (p-value = 1), sedangkan hasil ANOVA menunjukkan bahwa semua variabel independen berkontribusi terhadap model. Kesimpulan: Kedua metode menunjukkan performa yang baik dalam klasifikasi kanker, tetapi KNN dengan K=13 memiliki sedikit keunggulan dalam akurasi dan recall dibandingkan Regresi Logistik Biner. Implementasi model ini dapat mendukung sistem pendukung keputusan dalam diagnosis kanker untuk meningkatkan ketepatan hasil klasifikasi.
Referensi
Akri, Y. J. (2024). Potensi Tanaman Obat Indonesia Atasi Tumor Dan Kanker Tinjauan Sistematis. Jurnal Ilmu Kesehatan, 280-287.
Alfiani, D., Widayanti, & Putri, M. (2024). Literature Study: Obesitas Sebagai Faktor Risiko pada Kanker Payudara Triple Negative. Bandung Conference Series: Medical Science, 326-329.
Ali, M. M., Hariyati, Pratiwi, M. Y., & Afifah, S. (2022). Metodologi Penelitian Kuantitatif Dan Penenrapannya Dalam Penelitian. Education Journal, 1-6.
Alkhussayid, M. D., & Ferdiansyah. (2022). Implementasi Algoritma K-Nearest Neighbors Pada Penentuan Jurusan Siswa. Jurnal Sistem Komputer dan Informatika, 25-36.
Azhari, M., Situmorang, Z., & Rosnelly, R. (2021). Perbandingan Akurasi, Recall, dan Presisi Klasifikasi pada Algoritma C4.5, Random Forest, SVM dan Naive Bayes. Jurnal Media Informatika Budidarma, 640-651.
Azzahra, N. D., Ambarwati, A., Desiani, A., Maiyanti, S. I., & Ramayani, I. (2024). Perbandingan Algoritma K-Nearest Nighbor Dan Logistic Regression Dalam Klasifikasi Penyakit Kanker Servik. Jurnal Energy, 1-8.
Bakriansyah, M., Subair, A., & Setiawan, W. (2025). Penerapan Data Mining Untuk Memprediksi Penjualan Produk Terlaris UD Timbul Jaya Menggunakan Metode K-Nearst Neighbor. J-CEKI: Jurnal Cendikia Ilmiah, 327-337.
Cahyana, C. W., & Nurlayli, A. (2023). Analisis Performa Logistic Regression, Naive Bayes, dan Random Forest sebagai Algoritma Pendeteksi Kanker Payudara. Information System and Emerging Technology Journal, 51-64.
Cahyanti, D., Rahmayani, A., & Husniar, S. A. (2020). Analisis performa metode knn pada Datset pasien Pengidap Kanker Payudara. Indonesian Journal of Data and Science, 39-43.
Chtouki, K., Rhanoui, M., Mikram, M., & Yousfi, S. (2023). Supervised Machine Learning For Breast Cancer Risk Factors Analysis And Survival Prediction. A Preprint, 1-10.
Fahrurozi, & Wasilah. (2023). Deteksi Dini Kanker Payudara Menggunakan Algoritma K-Nearest Neighbor (KNN) Dan Decision Tree C-45. Teknika, 427-434.
Fajrin, J., Pathurahman, & Pratama, L. G. (2016). Aplikasi Metode Analysis of Variance (ANOVA) untuk Mengkaji Pengaruh Penambahan Silica Fume Terhadap Sifat Fisik dan Mekanik Mortar. Jurnal Rekayasa Sipil, 11-23.
Fasnuari, H. A., Yuana, H., & Chulkamdi, M. T. (2022). Penerapan Algoritma K-Nearest Neighbor (K-NN) Untuk Klasifikasi Penyakit Diabetes Melitus. ANTIVIRUS: Jurnal Ilmiah Teknik Informatika, 133-142.
Kainama, E. C., Palit, E. I., & Hutabarat, I. M. (2022). Analisis Pengaruh Pandemik COVID-19 Terhadap Laju Pertumbuhan Ekonomi Provinsi Papua Dengan Menggunakan Uji McNemar dan Uji Wilcoxon. Cendera Wasih Jurnal of Statistics and Data Science, 40-48.
Martha, S., Andani, W., & Rizki, S. W. (2022). Perbandingan Metode K-Nearest Neighbor, Regresi Logistik Biner, dan Pohon Klasifikasi pada Analisis Kelayakan Pemberian Kredit. EULER: Jurnal Ilmiah Matematika, Sains dan Teknologi, 262-273.
Prasetyo, E. (2012). K-Support Vector Nearest Neighbor Untuk Klasifikasi Berbasis K-NN. SESINDO - Jurusan Sistem Informasi ITS, 245-250.
Pratama, H. R., Naila, I., & Faradita, M. N. (2024). Analisis Keterampilan Kolaborasi Siswa Sekolah Dasar Menggunakan Media Diorama Pada Pembelajaran Materi Ekosistem. Pendas: Jurnal Ilmiah Pendidikan Dasar, 927-937.
Putri, A. A., Titaley, J., & Salaki, D. T. (2022). Model Regresi Logistik Biner Kecenderungan Gejala Maag Pada Mahasiswa Jurusan Matematika FMIPA UNSRAT. Jurnal Matematika dan Aplikasi, 38-43.
Salam, R. R., Jamil, M. F., Ibrahim, Y., Rahmadden, Soni, & Herianto. (2023). Analisis Sentimen Terhadap Bantuan Langsung Tunai (BLT) Bahan Bakar Minyak (BBM) Menggunakan Support Vector Machine. MALCOM: Indonesia Journal of Machine Learning and Computer Science, 27-35.
Solikin, I. (2021). Teknik Data Mining untuk Prediksi Kanker Payudara yang Efisien. Fidelity: Jurnal Teknik Elekrto, 63-67.
Sugiyono, & Hartinah, S. S. (2024). Pemodelan Data Mining Transaksi Penjualan Menggunakan Algoritma Apriori (Studi Kasus: Kedai Ngodeng & Smoothies). Jurnal Indonesia: Manajemen Informatika dan Komunikasi, 3080-3098.
Sujana, S., Juwita, A. R., Rahmat, & Faisal, S. (2024). Penerapan Metode Regresi Logistik Untuk Memprediksi Peristiwa Biner Pasien Pasca Operasi Kanker Payudara. Journal of Information System Research, 1095-1101.
Widyaningsih, Y., Arum, G. P., & Prawira, K. (2021). Aplikasi K-Fold Cross Validation Dalam Penentuan Model Regresi Binomial Negatif Terbaik. Barekeng: Jurnal Ilmu Matematika dan Terapan, 315-322.
Unduhan
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2025 Christina Amanda Surbakti, Albert Samuel Sinaga, Agnes Monica Simorangkir, Auta Shinta Sarah, Clara Jocelyn Harefa, Syairal Fahmy Dalimunthe

Artikel ini berlisensi Creative Commons Attribution 4.0 International License.









