Romadhon, Muhammad Saqti (2025) Kemiripan Kata (Semantic Similarity) pada terjemahan Al-Qur'an berbahasa Indonesia dengan kata yang disajikan dalam bentuk vektor dari Word2Vec. Sarjana thesis, UIN Sunan Gunung Djati Bandung.
|
Text (COVER)
1_cover.pdf Download (81kB) | Preview |
|
|
Text (ABSTRAK)
2_abstrak.pdf Download (210kB) | Preview |
|
|
Text (SK BEBAS PLAGIARISM)
3_skbebasplagiarism.pdf Download (356kB) | Preview |
|
|
Text (DAFTAR ISI)
4_daftarisi.pdf Download (71kB) | Preview |
|
|
Text (BAB I)
5_bab1.pdf Download (224kB) | Preview |
|
![]() |
Text (BAB II)
6_bab2.pdf Restricted to Registered users only Download (359kB) | Request a copy |
|
![]() |
Text (BAB III)
7_bab3.pdf Restricted to Registered users only Download (287kB) | Request a copy |
|
![]() |
Text (BAB IV)
8_bab4.pdf Restricted to Registered users only Download (399kB) | Request a copy |
|
![]() |
Text (BAB V)
9_bab5.pdf Restricted to Registered users only Download (112kB) | Request a copy |
|
![]() |
Text (DAFTAR PUSTAKA)
10_daftarpustaka.pdf Restricted to Registered users only Download (92kB) | Request a copy |
|
![]() |
Text (LAMPIRAN)
11_lampiran.pdf Restricted to Repository staff only Download (270kB) | Request a copy |
Abstract
Penelitian ini bertujuan untuk menganalisis kesamaan semantik antar kata dalam korpus terjemah Al-Qur’an Bahasa Indonesia menggunakan model Word2Vec dengan arsitektur Continuous Bag of Words (CBOW). Latar belakang penelitian ini didasarkan pada kebutuhan untuk memahami relasi makna kata dalam teks keagamaan yang memiliki struktur dan konteks khas. Data yang digunakan merupakan korpus Al-Qur’an terjemahan resmi dari Kementerian Agama RI yang diperoleh melalui situs tanzil.net. Proses pelatihan model dilakukan dengan pendekatan Hierarchical Softmax untuk mengurangi kompleksitas komputasi, serta eksperimen terhadap berbagai parameter pelatihan seperti ukuran dimensi vektor (vector size) dan lebar jendela konteks (window size). Tahap preprocessing mencakup tokenisasi, case folding, penghapusan simbol, dan stemming menggunakan library Sastrawi. Evaluasi model dilakukan dengan menghitung skor cosine similarity, rata-rata similarity, dan standar deviasi terhadap pasangan kata kunci keislaman. Hasil penelitian menunjukkan bahwa peningkatan vector size dari 50 ke 500 meningkatkan rata-rata similarity dari 0,7006 menjadi 0,7100, dengan window size optimal berada pada WS = 11. Visualisasi t-SNE menunjukkan klaster kata-kata bertema serupa yang merefleksikan relasi semantik yang berhasil ditangkap oleh model. Kesimpulannya, model Word2Vec arsitektur CBOW dengan parameter optimal mampu merepresentasikan makna kata dalam konteks terjemahan Al-Qur’an secara semantik dan konsisten.
Item Type: | Thesis (Sarjana) |
---|---|
Uncontrolled Keywords: | Word2Vec; semantic similarity; Al-Qur'an; Hierarchical Softmax; cosine similarity; CBOW; |
Subjects: | Data Processing, Computer Science Data Processing, Computer Science > Computers Mathematical Principles Mathematics > Data Processing and Analysis of Mathematics Applied mathematics > Programming Mathematics |
Divisions: | Fakultas Sains dan Teknologi > Program Studi Matematika |
Depositing User: | Saqti Romadhon Muhammad |
Date Deposited: | 20 Sep 2025 10:47 |
Last Modified: | 20 Sep 2025 10:47 |
URI: | https://digilib.uinsgd.ac.id/id/eprint/121045 |
Actions (login required)
![]() |
View Item |