Analisis Performa Logistic Regression dan Support Vector Classification untuk Klasifikasi Email Phising

Authors

  • Brury Barth Tangkere President University, Bekasi, Indonesia

DOI:

https://doi.org/10.31933/jemsi.v5i4.1916

Keywords:

Email Phising, Machine Learning, Logistic Regression, Support Vector Classification

Abstract

Keamanan siber merupakan suatu hal yang sangat penting diperhatikan terutama dengan maraknya perkembangan teknologi informasi dan komunikasi sekarang. Dengan semakin berkembangnya sektor informasi dan komunikasi serta mudahnya akses informasi, maka penting untuk dapat menjaga data pribadi sehingga tidak disalahgunakan oleh pihak tidak bertanggung jawab. Oleh karena itu, pada penelitian ini, akan melakukan proses klasifikasi email phising untuk mengetahui bahwa email yang diterima merupakan email yang aman atau tidak. Pada penelitian ini, akan menggunakan data dengan total sebanyak 18650 data yang dimana terdiri dari 11322 data email aman dan 7328 data email phising. Untuk melakukan proses klasifikasi, pada penelitian ini akan menggunakan algoritma Logistic Regression dan Support Vector Machine. Tujuan digunakannya kedua algoritma ini yaitu untuk menemukan mana algoritma yang dapat melakukan proses klasfikasi email phising dengan baik. Setelah dilakukannya pengujian klasifikasi, mendapatkan hasil bahwa proses klasifikasi dengan Logistic Regression mendapatkan akurasi sebesar 96.5% dan klasfikasi dengan Support Vector Classification mendapatkan akurasi sebesar 97.4%.

References

Azzani, I. K., Purwantoro, S. A., & Almubaroq, H. Z. (2023). Urgensi Peningkatan Kesadaran Masyarakat Tentang Kasus Penipuan Online Berkedok Kerja Paruh Waktu Sebagai Ancaman Negara. NUSANTARA: Jurnal Ilmu Pengetahuan Sosial, 10(7), 3556-3568. http://dx.doi.org/10.31604/jips.v10i7.2023.3556-3568

Arrasuli, B. K., & Fahmi, K. (2023). PERLINDUNGAN HUKUM POSITIF INDONESIA TERHADAP KEJAHATAN PENYALAHGUNAAN DATA PRIBADI. Unes Journal of Swara Justisia, 7(2), 369–392. https://doi.org/10.31933/ujsj.v7i2.351

Andriyanto, T. (2022). Komunikasi Termediasi Penipuan dengan Modus Business Email Compromise. Jurnal Riset Komunikasi, 5(2), 220-243. https://doi.org/10.38194/jurkom.v5i2.627

Wahyudi, W. R., Adriko, S. A., Firdaust, M. I., Harits, M. H. A., & Hapsari, D. P. (2023, April). Perbandingan Kinerja Algoritma Klasifikasi Naive Bayes, k-Nearest Neighbor dan Logistic Regression pada Dataset Multiclass. In Prosiding Seminar Nasional Teknik Elektro, Sistem Informasi, dan Teknik Informatika (SNESTIK) (Vol. 1, No. 1, pp. 380-386). https://doi.org/10.31284/p.snestik.2023.4157

Listanto, F. ., Fatchan, M. ., & Hadikristanto, W. (2023). Prediksi Defect Produk Casting Dengan Algoritma SVM Berbasis RBF dan Linier. Jurnal Ilmiah Intech : Information Technology Journal of UMUS, 5(2), 109–119. https://doi.org/10.46772/intech.v5i2.1376

AHMAD, N. ., PRASETYO, A. A. ., & MASRURI, A. . (2021). PENERAPAN INFORMATION RETRIEVAL PADA SEARCH ENGINE. KNOWLEDGE: Jurnal Inovasi Hasil Penelitian Dan Pengembangan, 1(1), 15-23. Retrieved from https://www.jurnalp4i.com/index.php/knowledge/article/view/771

M. Aufar, R. Andreswari and D. Pramesti, "Sentiment Analysis on Youtube Social Media Using Decision Tree and Random Forest Algorithm: A Case Study," 2020 International Conference on Data Science and Its Applications (ICoDSA), Bandung, Indonesia, 2020, pp. 1-7, doi: 10.1109/ICoDSA50139.2020.9213078.

Jehad, R., & A. Yousif, S. (2020). Fake News Classification Using Random Forest and Decision Tree (J48). Al-Nahrain Journal of Science, 23(4), 49–55. Retrieved from https://anjs.edu.iq/index.php/anjs/article/view/2306

Luthfiyah Annisa, & Anna Dina Kalifia. (2024). Analisis Teknik TF-IDF Dalam Identifikasi Faktor-Faktor Penyebab Depresi Pada Individu. Gudang Jurnal Multidisiplin Ilmu, 2(1), 302–307. https://doi.org/10.59435/gjmi.v2i1.249

Strzelecka, A., Kurdy?-Kujawska, A., & Zawadzka, D. (2020). Application of logistic regression models to assess household financial decisions regarding debt. Procedia Computer Science, 176, 3418–3427. doi:10.1016/j.procs.2020.09.055

Savitri, N. L. P. C., Rahman, R. A., Venyutzky, R., & Rakhmawati, N. A. (2021). Analisis Klasifikasi Sentimen Terhadap Sekolah Daring pada Twitter Menggunakan Supervised Machine Learning. Jurnal Teknik Informatika Dan Sistem Informasi, 7(1). https://doi.org/10.28932/jutisi.v7i1.3216

Siregar, Z., & Marpaung, T. B. (2020). Pemanfaatan Teknologi Informasi dan Komunikasi (TIK) Dalam Pembelajaran di Sekolah. BEST Journal (Biology Education, Sains and Technology), 3(1), 61-69. https://doi.org/10.30743/best.v3i1.2437

Saly, J. N., & Sulthanah, L. T. (2023). Pelindungan Data Pribadi dalam Tindakan Doxing Berdasarkan Undang-Undang Nomor 27 Tahun 2022. Jurnal Kewarganegaraan, 7(2), 1708-1713. https://doi.org/10.31316/jk.v7i2.5413

Uly, N., Hendry, H., & Iriani, A. (2023). CNN-RNN Hybrid Model for Diagnosis of COVID-19 on X-Ray Imagery: Hybrid Model CNN-RNN untuk Diagnosis COVID-19 pada Citra X-Ray. Digital Zone: Jurnal Teknologi Informasi Dan Komunikasi, 14(1), 57-67. https://doi.org/10.31849/digitalzone.v14i1.13668

Downloads

Published

2024-04-19

How to Cite

Brury Barth Tangkere. (2024). Analisis Performa Logistic Regression dan Support Vector Classification untuk Klasifikasi Email Phising. Jurnal Ekonomi Manajemen Sistem Informasi, 5(4), 442–450. https://doi.org/10.31933/jemsi.v5i4.1916