Pengaruh parameter n-gram pada training FastText terhadap similarity kata menggunakan data terjemah Al-Qur'an bahasa Inggris

Aini, Rissa Qurotul (2025) Pengaruh parameter n-gram pada training FastText terhadap similarity kata menggunakan data terjemah Al-Qur'an bahasa Inggris. Sarjana thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text
1_cover.pdf

Download (90kB) | Preview
[img]
Preview
Text
2_abstrak.pdf

Download (226kB) | Preview
[img]
Preview
Text
3_skbebasplagiarism.pdf

Download (174kB) | Preview
[img]
Preview
Text
4_daftarisi.pdf

Download (33kB) | Preview
[img]
Preview
Text
5_bab1.pdf

Download (289kB) | Preview
[img] Text
6_bab2.pdf
Restricted to Registered users only

Download (406kB) | Request a copy
[img] Text
7_bab3.pdf
Restricted to Registered users only

Download (162kB) | Request a copy
[img] Text
8_bab4.pdf
Restricted to Registered users only

Download (447kB) | Request a copy
[img] Text
9_bab5.pdf
Restricted to Registered users only

Download (114kB) | Request a copy
[img] Text
10_daftarpustaka.pdf
Restricted to Registered users only

Download (77kB) | Request a copy
[img] Text
11_lampiran.pdf
Restricted to Repository staff only

Download (59kB) | Request a copy

Abstract

Analisis hubungan tematik dalam teks keagamaan seperti terjemahan Al-Qur’an merupakan tantangan karena kompleksitas semantic dan morfologinya. Meskipun model word embedding seperti FastText diakui unggul karena kemampuannya menganalisis sub-word, pengaruh spesifik dari parameter n-gram terhadap kualitas similaritas kata pada korpus ini belum banyak diteliti. Penelitian ini bertujuan untuk menganalisis secara sistematis pengaruh parameter n-gram pada model FastText untuk mengukur kemiripan kata dan mengungkap klaster-klaster tematik dalam data terjemahan Al-Qur’an bahasa Inggris. Metode penelitian menggunakan dataset terjemahan Al-Qur’an yang melalui tahap pra-pemrosesan teks, pelatihan model FastText dengan berbagai konfigurasi n-gram, dan evaluasi kuantitatif menggunakan cosine similarity serta visualisasi dengan PCA. Hasil penelitian menunjukkan bahwa parameter n-gram secara fundamental meningkatkan kemampuan model dalam menangani variasi struktur kata. Pengaturan n-gram terbukti krusial untuk membangun model yang tangguh dalam menangkap hubungan semantic yang mendalam pada teks keagamaan.

Item Type: Thesis (Sarjana)
Uncontrolled Keywords: FastText; n-gram; Word Embedding; Kemiripan Kata; Cosine Similarity; Al-Qur’an; NLP
Subjects: Al-Qur'an (Al Qur'an, Alquran, Quran) dan Ilmu yang Berkaitan > Al-Qur'an dan Terjemahannya
Al-Qur'an (Al Qur'an, Alquran, Quran) dan Ilmu yang Berkaitan > Kumpulan Ayat-ayat dan Surat-surat Tertentu dalam Al-Qur'an
Applied mathematics > Probabilities
Applied mathematics > Programming Mathematics
Divisions: Fakultas Sains dan Teknologi > Program Studi Matematika
Depositing User: Rissa Qurotul aini
Date Deposited: 13 Aug 2025 04:16
Last Modified: 13 Aug 2025 04:16
URI: https://digilib.uinsgd.ac.id/id/eprint/114849

Actions (login required)

View Item View Item