Algoritma Clustering K-Means++ pada data terjemahan hadis

Maulana, Septian (2022) Algoritma Clustering K-Means++ pada data terjemahan hadis. Sarjana thesis, UIN Sunan Gunung Djati Bandung.

Preview

Text (COVER)
1_cover.pdf
Download (32kB) | Preview

Preview

Text (ABSTRAK)
2_abstrak.pdf
Download (28kB) | Preview

Preview

Text (DAFTAR ISI)
3_daftarisi.pdf
Download (143kB) | Preview

Preview

Text (BAB I)
4_bab1.pdf
Download (214kB) | Preview

Text (BAB II)
5_bab2.pdf
Restricted to Registered users only
Download (286kB) | Request a copy

Text (BAB III)
6_bab3.pdf
Restricted to Registered users only
Download (875kB) | Request a copy

Text (BAB IV)
7_bab4.pdf
Restricted to Registered users only
Download (2MB) | Request a copy

Text (BAB V)
8_bab5.pdf
Restricted to Registered users only
Download (28kB) | Request a copy

Text (DAFTAR PUSTAKA)
9_daftarpustaka.pdf
Restricted to Registered users only
Download (187kB) | Request a copy

Abstract

Perkembangan teknologi mengakibatkan ketersediaan data yang semakin meningkat, peningkatan jumlah data ini juga terjadi pada data hadis. Dibutuhkan solusi matematis untuk memanfaatkan dan menggali informasi yang terdapat dalam data tersebut. Algoritma clustering K-Means++ merupakan salah satu metode yang dapat digunakan untuk mengatasi permasalahan ini. Pada penelitian ini digunakan algoritma clustering K-Means++ yang dipadukan dengan dua proximity measure berbasis dissimilarity yaitu cosine distance dan euclidean distance. Salah satu masalah utama yang harus diperhatikan dalam proses clustering adalah dimensi ruang fitur yang tinggi. Reduksi dimensi dapat dijadikan sebagai salah satu langkah optimasi pada algoritma clustering untuk mengurangi jumlah fitur (dimensi). Pada penelitian ini akan digunakan metode Principal Component Analysis (PCA) untuk mereduksi fitur-fitur yang kurang berpengaruh dan redudant tanpa mengurangi karakteristik data tersebut secara signifikan. Selanjutnya dilakukan perbandingan hasil clustering pada data terjemahan hadis yang berjumlah 5344 hadis menggunakan algoritma K-Means++ dengan masing-masing kombinasi dissimilarity measure tanpa reduksi dan menggunakan reduksi untuk mengetahui hasil clustering yang terbaik pada algoritma tersebut. Hasil clustering yang didapat setelah dilakukan evaluasi menggunakan Davies-Bouldin Index (DBI) dan Silhouette Coefficient (SC) menunjukkan clustering algoritma K-Means++ dengan kombinasi cosine distance menggunakan reduksi mempunyai hasil yang lebih baik jika dibandingkan dengan hasil masing-masing algoritma clustering K-Means++ dengan kombinasi dissimilarity measure tanpa reduksi dan menggunakan reduksi dengan nilai DBI terbaik 1,61217321 dan SC terbaik 0,02996795. Dengan demikian, kombinasi proximity measure menggunakan cosine distance dan reduksi dimensi menggunakan PCA dalam proses text clustering dapat meningkatkan akurasi clustering.

Item Type:	Thesis (Sarjana)
Uncontrolled Keywords:	K-Means++; Proximity; Principal Component Analysis; DaviesBouldin Index; Silhouette Coefficient
Subjects:	Applied mathematics
Divisions:	Fakultas Sains dan Teknologi > Program Studi Matematika
Depositing User:	Septian Arif Maulana
Date Deposited:	15 Sep 2022 05:19
Last Modified:	15 Sep 2022 05:19
URI:	https://digilib.uinsgd.ac.id/id/eprint/56838

Actions (login required)

View Item