Tsaniatuluzzma, Maulidah (2025) Pengaruh hyperarameter dalam fasttext terhadap semantic similarity kata menggunakan dataset Al-Qur’an bahasa Arab. Sarjana thesis, UIN Sunan Gunung Djati Bandung.
|
Text (COVER)
1_Cover.pdf Download (189kB) | Preview |
|
|
Text (ABSTRAK)
2_abstrak.pdf Download (246kB) | Preview |
|
|
Text (BEBAS PLAGIARISME)
3_skbebasplagiarism.pdf Download (256kB) | Preview |
|
|
Text (DAFTAR ISI)
4_daftarisi.pdf Download (153kB) | Preview |
|
|
Text (BAB I)
5_bab1.pdf Download (374kB) | Preview |
|
![]() |
Text (BAB II)
6_bab2.pdf Restricted to Registered users only Download (420kB) | Request a copy |
|
![]() |
Text (BAB III)
7_bab3.pdf Restricted to Registered users only Download (447kB) | Request a copy |
|
![]() |
Text (BAB IV)
8_bab4.pdf Restricted to Registered users only Download (2MB) | Request a copy |
|
![]() |
Text (BAB V)
9_bab5.pdf Restricted to Registered users only Download (248kB) | Request a copy |
|
![]() |
Text (DAFTAR PUSTAKA)
10_daftarpustaka.pdf Restricted to Registered users only Download (209kB) | Request a copy |
|
![]() |
Text (LAMPIRAN)
11_lampiran.pdf Restricted to Repository staff only Download (260kB) | Request a copy |
Abstract
Penelitian ini menganalisis pengaruh hyperparameter FastText terhadap kemiripan semantik kata pada dataset Al-Qur'an berbahasa Arab. Bahasa Arab Al-Qur'an yang kompleks memerlukan metode representasi kata yang akurat. Metodologi mencakup pengumpulan dataset 6.236 ayat dari Tanzil.net, diikuti pra-pemrosesan seperti tokenisasi, pembersihan teks, penghapusan stopwords, normalisasi, dan lemmatisasi. Model FastText dilatih menggunakan arsitektur Skip-gram, yang efektif untuk kata jarang muncul. Hyperparameter yang diuji meliputi dimensi vektor, window size, learning rate, minimum count, dan epoch. Evaluasi semantic Similarity menggunakan cosine Similarity menunjukkan konfigurasi optimal adalah dimensi embedding 300, 10 epoch, dan window size 5, dengan nilai similaritas mencapai 0.999. Visualisasi PCA memvalidasi kemampuan model FastText mengelompokkan kata berdasarkan makna dan konteks dalam Al-Qur'an, termasuk hubungan sinonim.
Item Type: | Thesis (Sarjana) |
---|---|
Uncontrolled Keywords: | FastText; Hyperparameter; Semantic Similarity; Al-Qur'an Bahasa Arab, Word Embedding |
Subjects: | Data Processing, Computer Science > Computers Mathematical Principles Linguistics > Mathematical Linguistics Applied mathematics > Programming Mathematics |
Divisions: | Fakultas Sains dan Teknologi > Program Studi Matematika |
Depositing User: | maulidah tsaniatuluzzma |
Date Deposited: | 21 Aug 2025 01:48 |
Last Modified: | 21 Aug 2025 01:48 |
URI: | https://digilib.uinsgd.ac.id/id/eprint/115507 |
Actions (login required)
![]() |
View Item |