Priatna, Nanda (2019) Analisis perbandingan Algoritma Clustering K-Means dan Dbscan untuk data teks terjemah hadits menggunakan ekstraksi ciri Hybrid. Diploma thesis, UIN Sunan Gunung Djati Bandung.
|
Text (COVER)
1_cover.pdf Download (29kB) | Preview |
|
|
Text (ABSTRAK)
2_abstrak.pdf Download (28kB) | Preview |
|
|
Text (DAFTAR ISI)
3_daftarisi.pdf Download (776kB) | Preview |
|
|
Text (BAB I)
4_bab1.pdf Download (259kB) | Preview |
|
Text (BAB II)
5_bab2.pdf Restricted to Registered users only Download (618kB) | Request a copy |
||
Text (BAB III)
6_bab3.pdf Restricted to Registered users only Download (1MB) | Request a copy |
||
Text (BAB IV)
7_bab4.pdf Restricted to Registered users only Download (1MB) | Request a copy |
||
Text (BAB V)
8_bab5.pdf Restricted to Registered users only Download (22kB) | Request a copy |
||
Text (DAFTAR PUSTAKA)
9_daftarpustaka.pdf Restricted to Registered users only Download (327kB) | Request a copy |
Abstract
Hasil clustering sangat dipengaruhi oleh metode clustering yang digunakan. Terdapat banyak sekali metode clustering yang sudah diperkenalkan dalam berbagai literatur. Pada peneliltian ini, penulis akan membandingkan dua metode clustering yaitu metode k-means dengan metode DBSCAN untuk mengetahui karakteristik dari metode k-Means dan DBSCAN. Selain pemilihan metode clustering, dimensi ruang fitur yang tinggi juga merupakan salah satu masalah utama yang harus diperhatikan dalam proses clustering. Oleh karena itu, diperlukan adanya proses reduksi dimensi untuk memilih atau menyeleksi subfitur yang informatif. Pada penelitian ini, akan digunakan metode reduksi hybrid dengan memadukan metode feature selection dan metode feature extraction untuk memilih atau menyeleksi subfitur yang informatif. Keefektifan metode yang diajukan diuji pada dataset berupa terjemahan hadits dalam bahasa Inggris yang berjumlah 892 hadits. Kemudian, melakukan evaluasi clustering dengan menggunakan metode Davies-Bouldin Index (DBI) dan silhoutte coefficient. Hasil uji coba menunjukkan bahwa metode k-means mempunyai keunggulan untuk mengatasi data yang mempunyai perbedaan kerapatan yang signifikan. Artinya, tidak akan ada data yang menjadi derau/noise sehingga semua data masuk ke dalam cluster. Pada algoritma DBSCAN, hal ini tidak dapat dilakukan. Metode DBSCAN sangat bagus digunakan untuk mengelompokkan data-data dengan kerapatan yang tinggi. Sedangkan k-means hanya menemukan klaster yang terbentuk saja tanpa memperhatikan kerapatan data klaster. DBSCAN juga mempunyai keunggulan untuk mendeteksi derau/noise. Kemudian, dengan diterapkannya metode reduksi yang memadukan metode feature selection dan metode feature extraction pada proses text clustering dapat meningkatkan akurasi clustering.
Item Type: | Thesis (Diploma) |
---|---|
Uncontrolled Keywords: | algoritma; dbscan; |
Subjects: | Mathematics Mathematics > Data Processing and Analysis of Mathematics |
Divisions: | Fakultas Sains dan Teknologi > Program Studi Matematika |
Depositing User: | Nanda Priatna Priatna |
Date Deposited: | 28 Jun 2019 06:42 |
Last Modified: | 28 Jun 2019 06:42 |
URI: | https://digilib.uinsgd.ac.id/id/eprint/21244 |
Actions (login required)
View Item |