Kurniawan, Deni (2024) Relasi semantik kata pada data terjemahan Al-Qur’an bahasa Indonesia menggunakan algoritma clustering k-means bertingkat. Sarjana thesis, UNIVERSITAS ISLAM NEGERI SUNAN GUNUNG DJATI.
|
Text (COVER)
COVER SKRIPSI_1207010014_DENI KURNIAWAN.pdf Download (120kB) | Preview |
|
|
Text (ABSTRAK)
ABSTRAK SKRIPSI_1207010014_DENI KURNIAWAN.pdf Download (134kB) | Preview |
|
|
Text (DAFTAR ISI)
DAFTAR ISI SKRIPSI_1207010014_DENI KURNIAWAN.pdf Download (550kB) | Preview |
|
|
Text (BAB I)
BAB I SKRIPSI_1207010014_DENI KURNIAWAN.pdf Download (481kB) | Preview |
|
Text (BAB II)
BAB II SKRIPSI_1207010014_DENI KURNIAWAN.pdf Restricted to Registered users only Download (535kB) |
||
Text (BAB III)
BAB III SKRIPSI_1207010014_DENI KURNIAWAN.pdf Restricted to Registered users only Download (1MB) |
||
Text (BAB IV)
BAB IV SKRIPSI_1207010014_DENI KURNIAWAN.pdf Restricted to Registered users only Download (1MB) |
||
Text (BAB V)
BAB V SKRIPSI_1207010014_DENI KURNIAWAN.pdf Restricted to Registered users only Download (152kB) |
||
Text (DAFTAR PUSTAKA)
DAFTAR PUSTAKA SKRIPSI_1207010014_DENI KURNIAWAN.pdf Restricted to Registered users only Download (151kB) |
Abstract
Kemajuan teknologi informasi telah menghasilkan volume data yang sangat besar dan beragam. Untuk mengekstrak informasi dari data ini, dilakukan penggalian data (data mining). Dalam konteks data teks, objek yang diekstraksi bisa berupa kata, kalimat, paragraf, atau dokumen. Metode-metode data mining berbasis embedding prediktif masih jarang diterapkan pada dokumen-dokumen Islam, yang menjadi motivasi utama penelitian ini. Penelitian ini menggunakan word2vec untuk menghasilkan representasi numerik dari kata-kata dalam teks terjemahan Al-Qur'an bahasa Indonesia. Metode clustering digunakan untuk mengelompokkan representasi numerik dari kata-kata ini. Dengan menerapkan pendekatan hierarki pada algoritma clustering k-means bertingkat, data dikelompokkan secara bertahap melalui beberapa iterasi clustering, yang memungkinkan pembentukan subcluster di dalam cluster utama. Proses ini tidak hanya mempermudah penentuan nilai k secara bertahap, tetapi juga membantu dalam menyeimbangkan ukuran cluster dengan lebih baik. Analisis hasil clustering menunjukkan bahwa kelompok-kelompok kata berdasarkan logika linguistik yang diperoleh dari algoritma clustering k-means bertingkat memiliki nilai cosine similarity yang tinggi yang mendekati nilai 1, hal ini menunjukkan keterikatan semantik yang kuat antar kata dalam cluster. Pola karakteristik relasi semantik kata dari cluster yang diperoleh mencerminkan frekuensi dan kemunculan kata-kata dalam ayat-ayat Al-Qur'an pada konteks topik yang sama, di mana kata-kata yang sering muncul bersama dalam konteks yang sama akan memiliki vektor yang lebih dekat satu sama lain.
Item Type: | Thesis (Sarjana) |
---|---|
Uncontrolled Keywords: | data mining; word2vec; k-means bertingkat; silhouette coefficient; cosine similarity |
Subjects: | Linguistics > Mathematical Linguistics Numerical Analysis > Algorithms Applied mathematics > Programming Mathematics |
Divisions: | Fakultas Sains dan Teknologi > Program Studi Matematika |
Depositing User: | Deni Kurniawan |
Date Deposited: | 03 Sep 2024 06:48 |
Last Modified: | 03 Sep 2024 06:48 |
URI: | https://digilib.uinsgd.ac.id/id/eprint/81801 |
Actions (login required)
View Item |