Gusniar, Yulianti (2022) Part of Speech Tagging Al-Qur’an menggunakan kombinasi dengan Metode K-Nearest Neighbor dan Naive Bayes. Sarjana thesis, UIN Sunan Gunung Djati Bandung.
|
Text (COVER)
1_cover.pdf Download (193kB) | Preview |
|
|
Text (ABSTRAK)
2_abstrak.pdf Download (256kB) | Preview |
|
|
Text (DAFTAR ISI)
3_daftarisi.pdf Download (487kB) | Preview |
|
|
Text (BAB 1)
4_bab1.pdf Download (495kB) | Preview |
|
Text (BAB 2)
5_bab2.pdf Restricted to Registered users only Download (820kB) | Request a copy |
||
Text (BAB 3)
6_bab3.pdf Restricted to Registered users only Download (978kB) | Request a copy |
||
Text (BAB 4)
7_bab4.pdf Restricted to Registered users only Download (874kB) | Request a copy |
||
Text (BAB 5)
8_bab5.pdf Restricted to Registered users only Download (154kB) | Request a copy |
||
Text (DAFTAR PUSTAKA)
9_daftarpustaka.pdf Restricted to Registered users only Download (163kB) | Request a copy |
Abstract
Dalam linguistik, penandaan kelas kata (bahasa inggris: Part of Speech Tagging atau disingkat POST) adalah proses penandaan kata pada suatu teks (korpus) dalam kaitannya dengan suatu kelas kata tertentu berdasarkan definisi dan maknanya-hubungannya dengan kata yang mendampingi atau yang terkait dengannya pada suatu frasa, kalimat dan paragraf. Ini adalah proses pengelompokan setiap kata ke dalam bagian penandaan yang sesuai untuk konteks tertentu. Kerumitan teks bahasa Arab Al-Qur’an yang kini diketahui menyebabkan berbagai model penandaan POS berperfoma buruk dalam bahasa Arab Al-Qur’an. Akhirnya, ini akan menimbulkan sejumlah kesulitan untuk penandaan POS, termasuk ambiguitas yang signifikan, sedikitnya data, dan banyak kata tak dikenal. Perhatian utama di sini adalah untuk memastikan bagaimana pendekatan efektif berfungsi dalam bahasa Arab dan bagaimana korpus Qur’an dapat digunakan untuk membuat kerangka kerja yang efektif untuk penandaan POS Arab. Di sini peneliti akan menggabungkan dua metode statistik pengklasifikasi, yang pertama metode K-Nearest Neighbor (KNN) dan yang kedua metode Naïve Bayes (NB) dengan cara eksperimental untuk penandaan POS bahasa Arab. Lalu pendekatan kombinasi yang disebut Algoritma Voting Mayoritas (AVM) digunakan untuk memanfaatkan keunggulan pengklasifikasi. Peneliti telah menyelidiki banyak fitur untuk menentukan mana yang berguna dan bagaimana pengaruhnya terhadap kinerja penandaan POS Arab Qur’an. Oleh karena itu, tujuan dari penelitian ini adalah untuk menentukan set fitur mana yang berdampak dan untuk menstandarkan metode penandaan POS yang lebih tepat. Teks Al-Qur’an digunakan sebagai sumber data penelitian, dengan menggunakan Surah Al-Baqarah yang memiliki 6115 kata. Pendekatan metode Naïve Bayes yang menghasilkan nilai akurasi maksimal yaitu 54,50%. Elemen yang paling efektif menghasilkan akurasi ini adalah P0 (POS dari kata saat ini), W-3 (Kata dari tiga kata sebelumnya), P0 (POS dari kata saat ini), P1 (POS dari kata sesudahnya), S1, Sn, Huruf Besar, dan Berisi Nomor.
Item Type: | Thesis (Sarjana) |
---|---|
Uncontrolled Keywords: | Part of Speech Tagging; Bahasa Arab; Al-Qur'an; K-Nearest Neighbor (KNN); Naïve Bayes (NB); Algoritma Voting Mayoritas (AVM); Akurasi |
Subjects: | Mathematics Applied mathematics Applied mathematics > Programming Mathematics Applied mathematics > Special Topics of Applied Mathematics |
Divisions: | Fakultas Sains dan Teknologi > Program Studi Matematika |
Depositing User: | Gusniar Yulianti |
Date Deposited: | 22 May 2023 08:49 |
Last Modified: | 22 May 2023 08:49 |
URI: | https://digilib.uinsgd.ac.id/id/eprint/68305 |
Actions (login required)
View Item |