Part of Speech Tagging Al-Qur’an menggunakan kombinasi dengan Metode K-Nearest Neighbor dan Naive Bayes

Gusniar, Yulianti (2022) Part of Speech Tagging Al-Qur’an menggunakan kombinasi dengan Metode K-Nearest Neighbor dan Naive Bayes. Sarjana thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text (COVER)
1_cover.pdf

Download (193kB) | Preview
[img]
Preview
Text (ABSTRAK)
2_abstrak.pdf

Download (256kB) | Preview
[img]
Preview
Text (DAFTAR ISI)
3_daftarisi.pdf

Download (487kB) | Preview
[img]
Preview
Text (BAB 1)
4_bab1.pdf

Download (495kB) | Preview
[img] Text (BAB 2)
5_bab2.pdf
Restricted to Registered users only

Download (820kB) | Request a copy
[img] Text (BAB 3)
6_bab3.pdf
Restricted to Registered users only

Download (978kB) | Request a copy
[img] Text (BAB 4)
7_bab4.pdf
Restricted to Registered users only

Download (874kB) | Request a copy
[img] Text (BAB 5)
8_bab5.pdf
Restricted to Registered users only

Download (154kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
9_daftarpustaka.pdf
Restricted to Registered users only

Download (163kB) | Request a copy

Abstract

Dalam linguistik, penandaan kelas kata (bahasa inggris: Part of Speech Tagging atau disingkat POST) adalah proses penandaan kata pada suatu teks (korpus) dalam kaitannya dengan suatu kelas kata tertentu berdasarkan definisi dan maknanya-hubungannya dengan kata yang mendampingi atau yang terkait dengannya pada suatu frasa, kalimat dan paragraf. Ini adalah proses pengelompokan setiap kata ke dalam bagian penandaan yang sesuai untuk konteks tertentu. Kerumitan teks bahasa Arab Al-Qur’an yang kini diketahui menyebabkan berbagai model penandaan POS berperfoma buruk dalam bahasa Arab Al-Qur’an. Akhirnya, ini akan menimbulkan sejumlah kesulitan untuk penandaan POS, termasuk ambiguitas yang signifikan, sedikitnya data, dan banyak kata tak dikenal. Perhatian utama di sini adalah untuk memastikan bagaimana pendekatan efektif berfungsi dalam bahasa Arab dan bagaimana korpus Qur’an dapat digunakan untuk membuat kerangka kerja yang efektif untuk penandaan POS Arab. Di sini peneliti akan menggabungkan dua metode statistik pengklasifikasi, yang pertama metode K-Nearest Neighbor (KNN) dan yang kedua metode Naïve Bayes (NB) dengan cara eksperimental untuk penandaan POS bahasa Arab. Lalu pendekatan kombinasi yang disebut Algoritma Voting Mayoritas (AVM) digunakan untuk memanfaatkan keunggulan pengklasifikasi. Peneliti telah menyelidiki banyak fitur untuk menentukan mana yang berguna dan bagaimana pengaruhnya terhadap kinerja penandaan POS Arab Qur’an. Oleh karena itu, tujuan dari penelitian ini adalah untuk menentukan set fitur mana yang berdampak dan untuk menstandarkan metode penandaan POS yang lebih tepat. Teks Al-Qur’an digunakan sebagai sumber data penelitian, dengan menggunakan Surah Al-Baqarah yang memiliki 6115 kata. Pendekatan metode Naïve Bayes yang menghasilkan nilai akurasi maksimal yaitu 54,50%. Elemen yang paling efektif menghasilkan akurasi ini adalah P0 (POS dari kata saat ini), W-3 (Kata dari tiga kata sebelumnya), P0 (POS dari kata saat ini), P1 (POS dari kata sesudahnya), S1, Sn, Huruf Besar, dan Berisi Nomor.

Item Type: Thesis (Sarjana)
Uncontrolled Keywords: Part of Speech Tagging; Bahasa Arab; Al-Qur'an; K-Nearest Neighbor (KNN); Naïve Bayes (NB); Algoritma Voting Mayoritas (AVM); Akurasi
Subjects: Mathematics
Applied mathematics
Applied mathematics > Programming Mathematics
Applied mathematics > Special Topics of Applied Mathematics
Divisions: Fakultas Sains dan Teknologi > Program Studi Matematika
Depositing User: Gusniar Yulianti
Date Deposited: 22 May 2023 08:49
Last Modified: 22 May 2023 08:49
URI: https://digilib.uinsgd.ac.id/id/eprint/68305

Actions (login required)

View Item View Item