Penerapan Algoritma Optics Clustering dalam menangkap hubungan semantik kata menggunakan data Al-Qur'an terjemah bahasa Indonesia

Jaenuri, Imam (2025) Penerapan Algoritma Optics Clustering dalam menangkap hubungan semantik kata menggunakan data Al-Qur'an terjemah bahasa Indonesia. Sarjana thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text (COVER)
cover.pdf

Download (121kB) | Preview
[img]
Preview
Text (ABSTRAK)
abstrak.pdf

Download (284kB) | Preview
[img]
Preview
Text (PERNYATAAN KARYA MANDIRI)
CamScanner 22-04-2025 15.16.pdf

Download (77kB) | Preview
[img]
Preview
Text (DAFTAR ISI)
daftar isi.pdf

Download (339kB) | Preview
[img]
Preview
Text (BAB I)
bab 1.pdf

Download (299kB) | Preview
[img] Text (BAB II)
bab 2.pdf
Restricted to Registered users only

Download (739kB) | Request a copy
[img] Text (BAB III)
bab 3.pdf
Restricted to Registered users only

Download (551kB) | Request a copy
[img] Text (BAB IV)
bab 4.pdf
Restricted to Registered users only

Download (1MB) | Request a copy
[img] Text (BAB V)
bab 5.pdf
Restricted to Registered users only

Download (285kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
dapus.pdf
Restricted to Registered users only

Download (232kB) | Request a copy
[img] Text (LAMPIRAN)
Draft Skripsi Imam Jaenuri_fiks_pdf-111-142.pdf
Restricted to Repository staff only

Download (460kB) | Request a copy

Abstract

Perkembangan teknologi mendorong kebutuhan informasi yang relevan. Data Mining mampu melakukan ekstraksi informasi tersembunyi dari berbagai jenis data, misalnya penambangan data berbasis teks (text mining). Berbagai jenis metode penambangan data teks berfungsi untuk menangkap hubungan semantik kata melalui proses embedding. Word2Vec merupakan salah satu metode embedding yang terbukti efektif dalam analisis similaritas kata. Berdasarkan hal tersebut, penelitian ini dilakukan dengan menggunakan dataset terjemahan Al-Qur’an dalam bahasa Indonesia. Representasi vektor numerik yang dihasilkan oleh Word2Vec digunakan dalam proses pengelompokan menggunakan algoritma OPTICS clustering. Dengan kemampuannya dalam mengatasi variasi kepadatan data, OPTICS clustering cocok digunakan untuk menganalisis Al-Qur’an, yang memiliki banyak kesamaan karakteristik kata. Evaluasi cluster dilakukan melalui perhitungan silhouette score dan cosine similarity untuk melihat kemiripan kata. Sedangkan hasil sebaran cluster dianalisis menggunakan Calinski-Harabasz Index dan Density-Based Clustering Validation untuk menunjukkan tingkat kerapatan yang tinggi. Hasil menunjukkan Algoritma OPTICS efektif dalam mengelompokkan kosakata Al-Qur’an dengan kepadatan beragam. Metric Euclidean membantu identifikasi jarak, sementara epsilon dan xi berperan dalam pembentukan cluster. Silhouette score kurang relevan untuk hubungan semantik, sedangkan cosine similarity lebih sesuai. Validasi clustering menunjukkan DBCV 0,7550 lebih akurat dalam menilai kualitas cluster OPTICS dibandingkan Calinski-Harabasz Index 19,62.

Item Type: Thesis (Sarjana)
Uncontrolled Keywords: Data Mining; Text Mining; Word Embedding; Word2Vec; OPTICS clustering; Silhouette Score; Calinski-Harabasz Index Density-Based Clustering Validation.
Subjects: Mathematics > Data Processing and Analysis of Mathematics
Applied mathematics > Programming Mathematics
Applied mathematics > Special Topics of Applied Mathematics
Divisions: Fakultas Sains dan Teknologi > Program Studi Matematika
Depositing User: Imam Jaenuri
Date Deposited: 22 Apr 2025 08:22
Last Modified: 22 Apr 2025 08:22
URI: https://digilib.uinsgd.ac.id/id/eprint/106592

Actions (login required)

View Item View Item