Pengaruh hyperarameter dalam fasttext terhadap semantic similarity kata menggunakan dataset Al-Qur’an bahasa Arab

Tsaniatuluzzma, Maulidah (2025) Pengaruh hyperarameter dalam fasttext terhadap semantic similarity kata menggunakan dataset Al-Qur’an bahasa Arab. Sarjana thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text (COVER)
1_Cover.pdf

Download (189kB) | Preview
[img]
Preview
Text (ABSTRAK)
2_abstrak.pdf

Download (246kB) | Preview
[img]
Preview
Text (BEBAS PLAGIARISME)
3_skbebasplagiarism.pdf

Download (256kB) | Preview
[img]
Preview
Text (DAFTAR ISI)
4_daftarisi.pdf

Download (153kB) | Preview
[img]
Preview
Text (BAB I)
5_bab1.pdf

Download (374kB) | Preview
[img] Text (BAB II)
6_bab2.pdf
Restricted to Registered users only

Download (420kB) | Request a copy
[img] Text (BAB III)
7_bab3.pdf
Restricted to Registered users only

Download (447kB) | Request a copy
[img] Text (BAB IV)
8_bab4.pdf
Restricted to Registered users only

Download (2MB) | Request a copy
[img] Text (BAB V)
9_bab5.pdf
Restricted to Registered users only

Download (248kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
10_daftarpustaka.pdf
Restricted to Registered users only

Download (209kB) | Request a copy
[img] Text (LAMPIRAN)
11_lampiran.pdf
Restricted to Repository staff only

Download (260kB) | Request a copy

Abstract

Penelitian ini menganalisis pengaruh hyperparameter FastText terhadap kemiripan semantik kata pada dataset Al-Qur'an berbahasa Arab. Bahasa Arab Al-Qur'an yang kompleks memerlukan metode representasi kata yang akurat. Metodologi mencakup pengumpulan dataset 6.236 ayat dari Tanzil.net, diikuti pra-pemrosesan seperti tokenisasi, pembersihan teks, penghapusan stopwords, normalisasi, dan lemmatisasi. Model FastText dilatih menggunakan arsitektur Skip-gram, yang efektif untuk kata jarang muncul. Hyperparameter yang diuji meliputi dimensi vektor, window size, learning rate, minimum count, dan epoch. Evaluasi semantic Similarity menggunakan cosine Similarity menunjukkan konfigurasi optimal adalah dimensi embedding 300, 10 epoch, dan window size 5, dengan nilai similaritas mencapai 0.999. Visualisasi PCA memvalidasi kemampuan model FastText mengelompokkan kata berdasarkan makna dan konteks dalam Al-Qur'an, termasuk hubungan sinonim.

Item Type: Thesis (Sarjana)
Uncontrolled Keywords: FastText; Hyperparameter; Semantic Similarity; Al-Qur'an Bahasa Arab, Word Embedding
Subjects: Data Processing, Computer Science > Computers Mathematical Principles
Linguistics > Mathematical Linguistics
Applied mathematics > Programming Mathematics
Divisions: Fakultas Sains dan Teknologi > Program Studi Matematika
Depositing User: maulidah tsaniatuluzzma
Date Deposited: 21 Aug 2025 01:48
Last Modified: 21 Aug 2025 01:48
URI: https://digilib.uinsgd.ac.id/id/eprint/115507

Actions (login required)

View Item View Item