[Untitled]

Dublin Core

Description

Peningkatan jumlah pengguna email membuat proses klasifikasi email menjadisemakin penting. Diprediksi pada 2016 akan terdapat 4,3 miliar akun email.Namun, dalam pertumbuhannya tidak semua orang menggunakan teknologi emaildengan baik, bahkan penyalahgunaan email dengan mengirimkan email spammenyebabkan kerugian pada orang lain. Oleh karena itu dibutuhkan suatupenanganan agar email yang masuk ke kotak masuk pengguna dapat diklasifikasidengan benar apakah email yang masuk merupakan email spam atau bukan spam.Klasifikasi dilakukan dengan mengunduh dataset email spam dan bukan spam,membersihkan email, membuat kamus, membangun fitur serta mengklasifikasidengan Support Vector Machine (SVM) dan k-Nearest Neighbors (k-NN).Klasifikasi dengan menggunakan SVM dilakukan dengan menggunakan 3 (tiga)fungsi kernel yaitu kernel linier, polynomial dan radial. Klasifikasi menggunakank-NN dilakukan dengan parameter nilai k = 3, k = 5, k = ,7 k= 9 dan k = 11. Laludilakukan analisis pada proses pembelajaran menggunakan k-fold cross validationdan pengujian terhadap model yang dihasilkan. Pada percobaan ini dilakukanmetode multiple model voting dimana seluruh model yang dihasilkan dari prosespembelajaran digunakan pada saat klasifikasi. Hasil klasifikasi SVM dan k-NNdibandingkan dengan melihat nilai F-measure yang didapatkan dari kedua metode.Klasifikasi Menggunakan SVM mendapatkan nilai F-measure lebih baik daripadaklasifikasi menggunakan k-NN.Kata kunci: Klasifikasi email, Support Vector Machine, k-Nearest Neighbors, FMeasure

Creator

Khalid Imam

Identifier

http://etd.unsyiah.ac.id//index.php?p=show_detail&id=13785