Kemiripan Kata (Semantic Similarity) pada terjemahan Al-Qur'an berbahasa Indonesia dengan kata yang disajikan dalam bentuk vektor dari Word2Vec

Romadhon, Muhammad Saqti (2025) Kemiripan Kata (Semantic Similarity) pada terjemahan Al-Qur'an berbahasa Indonesia dengan kata yang disajikan dalam bentuk vektor dari Word2Vec. Sarjana thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text (COVER)
1_cover.pdf

Download (81kB) | Preview
[img]
Preview
Text (ABSTRAK)
2_abstrak.pdf

Download (210kB) | Preview
[img]
Preview
Text (SK BEBAS PLAGIARISM)
3_skbebasplagiarism.pdf

Download (356kB) | Preview
[img]
Preview
Text (DAFTAR ISI)
4_daftarisi.pdf

Download (71kB) | Preview
[img]
Preview
Text (BAB I)
5_bab1.pdf

Download (224kB) | Preview
[img] Text (BAB II)
6_bab2.pdf
Restricted to Registered users only

Download (359kB) | Request a copy
[img] Text (BAB III)
7_bab3.pdf
Restricted to Registered users only

Download (287kB) | Request a copy
[img] Text (BAB IV)
8_bab4.pdf
Restricted to Registered users only

Download (399kB) | Request a copy
[img] Text (BAB V)
9_bab5.pdf
Restricted to Registered users only

Download (112kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
10_daftarpustaka.pdf
Restricted to Registered users only

Download (92kB) | Request a copy
[img] Text (LAMPIRAN)
11_lampiran.pdf
Restricted to Repository staff only

Download (270kB) | Request a copy

Abstract

Penelitian ini bertujuan untuk menganalisis kesamaan semantik antar kata dalam korpus terjemah Al-Qur’an Bahasa Indonesia menggunakan model Word2Vec dengan arsitektur Continuous Bag of Words (CBOW). Latar belakang penelitian ini didasarkan pada kebutuhan untuk memahami relasi makna kata dalam teks keagamaan yang memiliki struktur dan konteks khas. Data yang digunakan merupakan korpus Al-Qur’an terjemahan resmi dari Kementerian Agama RI yang diperoleh melalui situs tanzil.net. Proses pelatihan model dilakukan dengan pendekatan Hierarchical Softmax untuk mengurangi kompleksitas komputasi, serta eksperimen terhadap berbagai parameter pelatihan seperti ukuran dimensi vektor (vector size) dan lebar jendela konteks (window size). Tahap preprocessing mencakup tokenisasi, case folding, penghapusan simbol, dan stemming menggunakan library Sastrawi. Evaluasi model dilakukan dengan menghitung skor cosine similarity, rata-rata similarity, dan standar deviasi terhadap pasangan kata kunci keislaman. Hasil penelitian menunjukkan bahwa peningkatan vector size dari 50 ke 500 meningkatkan rata-rata similarity dari 0,7006 menjadi 0,7100, dengan window size optimal berada pada WS = 11. Visualisasi t-SNE menunjukkan klaster kata-kata bertema serupa yang merefleksikan relasi semantik yang berhasil ditangkap oleh model. Kesimpulannya, model Word2Vec arsitektur CBOW dengan parameter optimal mampu merepresentasikan makna kata dalam konteks terjemahan Al-Qur’an secara semantik dan konsisten.

Item Type: Thesis (Sarjana)
Uncontrolled Keywords: Word2Vec; semantic similarity; Al-Qur'an; Hierarchical Softmax; cosine similarity; CBOW;
Subjects: Data Processing, Computer Science
Data Processing, Computer Science > Computers Mathematical Principles
Mathematics > Data Processing and Analysis of Mathematics
Applied mathematics > Programming Mathematics
Divisions: Fakultas Sains dan Teknologi > Program Studi Matematika
Depositing User: Saqti Romadhon Muhammad
Date Deposited: 20 Sep 2025 10:47
Last Modified: 20 Sep 2025 10:47
URI: https://digilib.uinsgd.ac.id/id/eprint/121045

Actions (login required)

View Item View Item