Jaenuri, Imam (2025) Penerapan Algoritma Optics Clustering dalam menangkap hubungan semantik kata menggunakan data Al-Qur'an terjemah bahasa Indonesia. Sarjana thesis, UIN Sunan Gunung Djati Bandung.
|
Text (COVER)
cover.pdf Download (121kB) | Preview |
|
|
Text (ABSTRAK)
abstrak.pdf Download (284kB) | Preview |
|
|
Text (PERNYATAAN KARYA MANDIRI)
CamScanner 22-04-2025 15.16.pdf Download (77kB) | Preview |
|
|
Text (DAFTAR ISI)
daftar isi.pdf Download (339kB) | Preview |
|
|
Text (BAB I)
bab 1.pdf Download (299kB) | Preview |
|
![]() |
Text (BAB II)
bab 2.pdf Restricted to Registered users only Download (739kB) | Request a copy |
|
![]() |
Text (BAB III)
bab 3.pdf Restricted to Registered users only Download (551kB) | Request a copy |
|
![]() |
Text (BAB IV)
bab 4.pdf Restricted to Registered users only Download (1MB) | Request a copy |
|
![]() |
Text (BAB V)
bab 5.pdf Restricted to Registered users only Download (285kB) | Request a copy |
|
![]() |
Text (DAFTAR PUSTAKA)
dapus.pdf Restricted to Registered users only Download (232kB) | Request a copy |
|
![]() |
Text (LAMPIRAN)
Draft Skripsi Imam Jaenuri_fiks_pdf-111-142.pdf Restricted to Repository staff only Download (460kB) | Request a copy |
Abstract
Perkembangan teknologi mendorong kebutuhan informasi yang relevan. Data Mining mampu melakukan ekstraksi informasi tersembunyi dari berbagai jenis data, misalnya penambangan data berbasis teks (text mining). Berbagai jenis metode penambangan data teks berfungsi untuk menangkap hubungan semantik kata melalui proses embedding. Word2Vec merupakan salah satu metode embedding yang terbukti efektif dalam analisis similaritas kata. Berdasarkan hal tersebut, penelitian ini dilakukan dengan menggunakan dataset terjemahan Al-Qur’an dalam bahasa Indonesia. Representasi vektor numerik yang dihasilkan oleh Word2Vec digunakan dalam proses pengelompokan menggunakan algoritma OPTICS clustering. Dengan kemampuannya dalam mengatasi variasi kepadatan data, OPTICS clustering cocok digunakan untuk menganalisis Al-Qur’an, yang memiliki banyak kesamaan karakteristik kata. Evaluasi cluster dilakukan melalui perhitungan silhouette score dan cosine similarity untuk melihat kemiripan kata. Sedangkan hasil sebaran cluster dianalisis menggunakan Calinski-Harabasz Index dan Density-Based Clustering Validation untuk menunjukkan tingkat kerapatan yang tinggi. Hasil menunjukkan Algoritma OPTICS efektif dalam mengelompokkan kosakata Al-Qur’an dengan kepadatan beragam. Metric Euclidean membantu identifikasi jarak, sementara epsilon dan xi berperan dalam pembentukan cluster. Silhouette score kurang relevan untuk hubungan semantik, sedangkan cosine similarity lebih sesuai. Validasi clustering menunjukkan DBCV 0,7550 lebih akurat dalam menilai kualitas cluster OPTICS dibandingkan Calinski-Harabasz Index 19,62.
Item Type: | Thesis (Sarjana) |
---|---|
Uncontrolled Keywords: | Data Mining; Text Mining; Word Embedding; Word2Vec; OPTICS clustering; Silhouette Score; Calinski-Harabasz Index Density-Based Clustering Validation. |
Subjects: | Mathematics > Data Processing and Analysis of Mathematics Applied mathematics > Programming Mathematics Applied mathematics > Special Topics of Applied Mathematics |
Divisions: | Fakultas Sains dan Teknologi > Program Studi Matematika |
Depositing User: | Imam Jaenuri |
Date Deposited: | 22 Apr 2025 08:22 |
Last Modified: | 22 Apr 2025 08:22 |
URI: | https://digilib.uinsgd.ac.id/id/eprint/106592 |
Actions (login required)
![]() |
View Item |