Kategorisasi buku dengan pendekatan klasifikasi multi label menggunakan agoritma K-Nearest Neighbor

Tyas, Suciati Ayuning (2024) Kategorisasi buku dengan pendekatan klasifikasi multi label menggunakan agoritma K-Nearest Neighbor. Sarjana thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text (COVER)
1_cover.pdf

Download (84kB) | Preview
[img]
Preview
Text (ABSTRAK)
2_abstrak.pdf

Download (34kB) | Preview
[img]
Preview
Text (DAFTAR ISI)
3_daftarisi.pdf

Download (40kB) | Preview
[img]
Preview
Text (BAB I)
4_bab1.pdf

Download (162kB) | Preview
[img] Text (BAB II)
5_bab2.pdf
Restricted to Registered users only

Download (209kB) | Request a copy
[img] Text (BAB III)
6_bab3.pdf
Restricted to Registered users only

Download (360kB) | Request a copy
[img] Text (BAB IV)
7_bab4.pdf
Restricted to Registered users only

Download (1MB) | Request a copy
[img] Text (BAB V)
8_bab5.pdf
Restricted to Registered users only

Download (30kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
9_daftarpustaka.pdf
Restricted to Registered users only

Download (107kB) | Request a copy

Abstract

Klasifikasi multi label untuk menentukan kategori buku perlu dilakukan untuk mempermudah pengunjung perpustakaan UIN Sunan Gunung Djati Bandung dalam menemukan buku dengan jurusan yang sesuai. Dilansir dari website perpustakaan UIN Sunan Gunung Djati Bandung, kata kunci pencarian terpopuler selama satu tahun terakhir menunjukkan kata kunci untuk jurusan yang sesuai. Penelitian ini bertujuan untuk membangun model yang mampu mengklasifikasikan buku dengan teknologi pembelajaran mesin, khususnya klasifikasi teks. Metode yang digunakan adalah K-Nearest Neighbor (KNN) dengan metric cosine similarity dan tambahan grid search cv untuk menentukan parameter yang optimal. Hasil penelitian menunjukkan bahwa kombinasi KNN, cosine similarity dapat diterapkan pada model untuk klasifikasi multi-label dengan beberapa skenario nilai K. Tingkat akurasi tertinggi model dengan data splitting 80% data training 20% data testing dan parameter K = 5 mencapai 75%, hamming loss sebesar 0.05%, precission 87%, recall 79%, f1-score 83%. Keterbatasan dataset serta distribusi data yang tidak seimbang dapat memengaruhi performa model klasifikasi. Pada penelitian ini, parameter nilai K berpengaruh dalam tingkat akurasi model namun tidak signifikan. Namun pemilihan parameter yang sesuai dapat membuat performa model menjadi optimal.

Item Type: Thesis (Sarjana)
Uncontrolled Keywords: KNN; Multi Label; Klasifikasi Buku; Grid Search CV
Subjects: Systems > Computer Modeling and Simulation
Applied Physics > Computer Engineering
Divisions: Fakultas Sains dan Teknologi > Program Studi Teknik Informatika
Depositing User: Suciati Ayuning Tyas
Date Deposited: 02 Sep 2024 05:23
Last Modified: 02 Sep 2024 05:23
URI: https://digilib.uinsgd.ac.id/id/eprint/94559

Actions (login required)

View Item View Item