Maulana, Septian (2022) Algoritma Clustering K-Means++ pada data terjemahan hadis. Sarjana thesis, UIN Sunan Gunung Djati Bandung.
|
Text (COVER)
1_cover.pdf Download (32kB) | Preview |
|
|
Text (ABSTRAK)
2_abstrak.pdf Download (28kB) | Preview |
|
|
Text (DAFTAR ISI)
3_daftarisi.pdf Download (143kB) | Preview |
|
|
Text (BAB I)
4_bab1.pdf Download (214kB) | Preview |
|
Text (BAB II)
5_bab2.pdf Restricted to Registered users only Download (286kB) | Request a copy |
||
Text (BAB III)
6_bab3.pdf Restricted to Registered users only Download (875kB) | Request a copy |
||
Text (BAB IV)
7_bab4.pdf Restricted to Registered users only Download (2MB) | Request a copy |
||
Text (BAB V)
8_bab5.pdf Restricted to Registered users only Download (28kB) | Request a copy |
||
Text (DAFTAR PUSTAKA)
9_daftarpustaka.pdf Restricted to Registered users only Download (187kB) | Request a copy |
Abstract
Perkembangan teknologi mengakibatkan ketersediaan data yang semakin meningkat, peningkatan jumlah data ini juga terjadi pada data hadis. Dibutuhkan solusi matematis untuk memanfaatkan dan menggali informasi yang terdapat dalam data tersebut. Algoritma clustering K-Means++ merupakan salah satu metode yang dapat digunakan untuk mengatasi permasalahan ini. Pada penelitian ini digunakan algoritma clustering K-Means++ yang dipadukan dengan dua proximity measure berbasis dissimilarity yaitu cosine distance dan euclidean distance. Salah satu masalah utama yang harus diperhatikan dalam proses clustering adalah dimensi ruang fitur yang tinggi. Reduksi dimensi dapat dijadikan sebagai salah satu langkah optimasi pada algoritma clustering untuk mengurangi jumlah fitur (dimensi). Pada penelitian ini akan digunakan metode Principal Component Analysis (PCA) untuk mereduksi fitur-fitur yang kurang berpengaruh dan redudant tanpa mengurangi karakteristik data tersebut secara signifikan. Selanjutnya dilakukan perbandingan hasil clustering pada data terjemahan hadis yang berjumlah 5344 hadis menggunakan algoritma K-Means++ dengan masing-masing kombinasi dissimilarity measure tanpa reduksi dan menggunakan reduksi untuk mengetahui hasil clustering yang terbaik pada algoritma tersebut. Hasil clustering yang didapat setelah dilakukan evaluasi menggunakan Davies-Bouldin Index (DBI) dan Silhouette Coefficient (SC) menunjukkan clustering algoritma K-Means++ dengan kombinasi cosine distance menggunakan reduksi mempunyai hasil yang lebih baik jika dibandingkan dengan hasil masing-masing algoritma clustering K-Means++ dengan kombinasi dissimilarity measure tanpa reduksi dan menggunakan reduksi dengan nilai DBI terbaik 1,61217321 dan SC terbaik 0,02996795. Dengan demikian, kombinasi proximity measure menggunakan cosine distance dan reduksi dimensi menggunakan PCA dalam proses text clustering dapat meningkatkan akurasi clustering.
Item Type: | Thesis (Sarjana) |
---|---|
Uncontrolled Keywords: | K-Means++; Proximity; Principal Component Analysis; DaviesBouldin Index; Silhouette Coefficient |
Subjects: | Applied mathematics |
Divisions: | Fakultas Sains dan Teknologi > Program Studi Matematika |
Depositing User: | Septian Arif Maulana |
Date Deposited: | 15 Sep 2022 05:19 |
Last Modified: | 15 Sep 2022 05:19 |
URI: | https://digilib.uinsgd.ac.id/id/eprint/56838 |
Actions (login required)
View Item |