Relasi semantik kata pada data terjemahan Al-Qur’an bahasa Indonesia menggunakan algoritma clustering k-means bertingkat

Kurniawan, Deni (2024) Relasi semantik kata pada data terjemahan Al-Qur’an bahasa Indonesia menggunakan algoritma clustering k-means bertingkat. Sarjana thesis, UNIVERSITAS ISLAM NEGERI SUNAN GUNUNG DJATI.

[img]
Preview
Text (COVER)
COVER SKRIPSI_1207010014_DENI KURNIAWAN.pdf

Download (120kB) | Preview
[img]
Preview
Text (ABSTRAK)
ABSTRAK SKRIPSI_1207010014_DENI KURNIAWAN.pdf

Download (134kB) | Preview
[img]
Preview
Text (DAFTAR ISI)
DAFTAR ISI SKRIPSI_1207010014_DENI KURNIAWAN.pdf

Download (550kB) | Preview
[img]
Preview
Text (BAB I)
BAB I SKRIPSI_1207010014_DENI KURNIAWAN.pdf

Download (481kB) | Preview
[img] Text (BAB II)
BAB II SKRIPSI_1207010014_DENI KURNIAWAN.pdf
Restricted to Registered users only

Download (535kB)
[img] Text (BAB III)
BAB III SKRIPSI_1207010014_DENI KURNIAWAN.pdf
Restricted to Registered users only

Download (1MB)
[img] Text (BAB IV)
BAB IV SKRIPSI_1207010014_DENI KURNIAWAN.pdf
Restricted to Registered users only

Download (1MB)
[img] Text (BAB V)
BAB V SKRIPSI_1207010014_DENI KURNIAWAN.pdf
Restricted to Registered users only

Download (152kB)
[img] Text (DAFTAR PUSTAKA)
DAFTAR PUSTAKA SKRIPSI_1207010014_DENI KURNIAWAN.pdf
Restricted to Registered users only

Download (151kB)

Abstract

Kemajuan teknologi informasi telah menghasilkan volume data yang sangat besar dan beragam. Untuk mengekstrak informasi dari data ini, dilakukan penggalian data (data mining). Dalam konteks data teks, objek yang diekstraksi bisa berupa kata, kalimat, paragraf, atau dokumen. Metode-metode data mining berbasis embedding prediktif masih jarang diterapkan pada dokumen-dokumen Islam, yang menjadi motivasi utama penelitian ini. Penelitian ini menggunakan word2vec untuk menghasilkan representasi numerik dari kata-kata dalam teks terjemahan Al-Qur'an bahasa Indonesia. Metode clustering digunakan untuk mengelompokkan representasi numerik dari kata-kata ini. Dengan menerapkan pendekatan hierarki pada algoritma clustering k-means bertingkat, data dikelompokkan secara bertahap melalui beberapa iterasi clustering, yang memungkinkan pembentukan subcluster di dalam cluster utama. Proses ini tidak hanya mempermudah penentuan nilai k secara bertahap, tetapi juga membantu dalam menyeimbangkan ukuran cluster dengan lebih baik. Analisis hasil clustering menunjukkan bahwa kelompok-kelompok kata berdasarkan logika linguistik yang diperoleh dari algoritma clustering k-means bertingkat memiliki nilai cosine similarity yang tinggi yang mendekati nilai 1, hal ini menunjukkan keterikatan semantik yang kuat antar kata dalam cluster. Pola karakteristik relasi semantik kata dari cluster yang diperoleh mencerminkan frekuensi dan kemunculan kata-kata dalam ayat-ayat Al-Qur'an pada konteks topik yang sama, di mana kata-kata yang sering muncul bersama dalam konteks yang sama akan memiliki vektor yang lebih dekat satu sama lain.

Item Type: Thesis (Sarjana)
Uncontrolled Keywords: data mining; word2vec; k-means bertingkat; silhouette coefficient; cosine similarity
Subjects: Linguistics > Mathematical Linguistics
Numerical Analysis > Algorithms
Applied mathematics > Programming Mathematics
Divisions: Fakultas Sains dan Teknologi > Program Studi Matematika
Depositing User: Deni Kurniawan
Date Deposited: 03 Sep 2024 06:48
Last Modified: 03 Sep 2024 06:48
URI: https://digilib.uinsgd.ac.id/id/eprint/81801

Actions (login required)

View Item View Item