Dublin Core
Title
ANALISA PEMBARUAN KAMUS SECARA OTOMATIS DALAM PENGKATEGORIAN HALAMAN WEB PENYAKIT TROPIS
Description
Peningkatan jumlah halaman web cukup signifikan belakangan ini membuat proses pengklasifikasian halaman web menjadi semakin penting. Kamus (tesaurus) dalam pengklasifikasian halaman web adalah salah satu cara untuk meningkatkan akurasi. Tesaurus yang selama ini digunakan adalah tesaurus statis yang hanya dibangun sekali sehingga diperlukan algoritma dan analisis dalam pembaruan tesaurus. Algoritma yang dilakukan adalah mengunduh halaman web, membersihkan halaman web, membuat fitur, mengklasifikasi dengan SVM (Support Vector Machine), melakukan tokenisasi hasil klasifikasi halaman web, memperbarui tesaurus, dan menganalisis tesaurus. Dalam percobaan ini, pembaruan tesaurus dilakukan dengan 2 tahap. Tahap pertama pembaruan tesaurus dengan 10000 halaman web membutuhkan waktu 2 detik dan terjadi sedikit penurunan nilai precision, recall dan f-measure. Tahap kedua pembaruan tesaurus juga dilakukan dengan 10000 halaman web membutuhkan waktu 3 detik dan kembali terjadi sedikit penurunan nilai precision, recall dan f-measure. Selanjutnya, dilakukan analisis dengan eliminasi rasio dan eliminasi frekuensi terkecil. Pembaruan tahap pertama dan kedua dengan eliminasi rasio meningkatkan nilai akurasi, namun tidak signifikan, sedangkan penggabungan eliminasi rasio dan eliminasi frekuensi terkecil mengakibatkan nilai precision dan f-measure meningkat secara signifikan, walau nilai recall sedikit menurun, namun tidak terlalu berpengaruh terhadap hasil klasifikasi.
Creator
Ulfa Nadia
Identifier
http://etd.unsyiah.ac.id//index.php?p=show_detail&id=7222