Implementasi model XLM-ROBERTA pada Question Answering Dataset SQUAD 2.0

Firmansyah, Muhamad Rizal (2023) Implementasi model XLM-ROBERTA pada Question Answering Dataset SQUAD 2.0. Sarjana thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text
1_cover.pdf

Download (82kB) | Preview
[img]
Preview
Text
2_abstrak.pdf

Download (100kB) | Preview
[img]
Preview
Text
3_daftarisi.pdf

Download (135kB) | Preview
[img]
Preview
Text
4_bab1.pdf

Download (340kB) | Preview
[img] Text
5_bab2.pdf
Restricted to Registered users only

Download (410kB) | Request a copy
[img] Text
6_bab3.pdf
Restricted to Registered users only

Download (1MB) | Request a copy
[img] Text
7_bab4.pdf
Restricted to Registered users only

Download (3MB) | Request a copy
[img] Text
8_bab5.pdf
Restricted to Registered users only

Download (50kB) | Request a copy
[img] Text
9_daftarpustaka.pdf
Restricted to Registered users only

Download (120kB) | Request a copy

Abstract

Banyaknya informasi yang tersedia di internet berupa teks menyebabkan suatu masalah information overload muncul. Pengguna internet di era 4.0 mungkin merasa terlalu banyak informasi yang tersedia, sehingga sulit bagi mereka untuk memproses dan menyimpan pengetahuan secara efektif. Sistem Question Answering dapat membantu pembelajar di era 4.0 dengan cepat dan akurat mendapatkan informasi yang mereka butuhkan dari banyak informasi yang tersedia. Dengan memanfaatkan teknologi natural language processing khususnya Question Answering ekstraksi pengetahuan dari informasi yang berjumlah banyak dapat menjadi lebih cepat dan akurat. Metode yang digunakan untuk pembangunan model Question Answering yaitu CRISP-DM lalu model yang digunakan yaitu XLM-RoBERTa sebagai pre-trained model yang akan dibangun menjadi model Question Answering. Data yang digunakan untuk pelatihan adalah Stanford Question Answering Dataset atau SQuAD 2.0 versi ukuran kecil dan besar. Tujuan penelitian ini adalah untuk menerapkan dan mengukur kinerja model XLM - RoBERTa pada Question Answering pada dataset bahan ajar berupa data validasi SQuAD 2.0, dan data sejarah UIN dengan hasil yang diperoleh berhasil mendapatkan kinerja optimal nya yang mencapai rata-rata recall 71.3%, precision 70.1%, 68.4% dan accuracy 63.5%.

Item Type: Thesis (Sarjana)
Uncontrolled Keywords: CRISP-DM; information overload; question answering; SQuAD 2.0; XLM-RoBERTa
Subjects: Special Computer Methods > Artificial Intelligence
Divisions: Fakultas Sains dan Teknologi > Program Studi Teknik Informatika
Depositing User: Muhamad Rizal Firmansyah
Date Deposited: 07 Aug 2023 04:51
Last Modified: 07 Aug 2023 04:51
URI: https://digilib.uinsgd.ac.id/id/eprint/73073

Actions (login required)

View Item View Item