Optimasi Chatbot berbasis Large Language Models (LLM) melalui Integrasi Retrieval-Augmented Generation (RAG)

Fakhruddin, Muhammad Fakhri (2025) Optimasi Chatbot berbasis Large Language Models (LLM) melalui Integrasi Retrieval-Augmented Generation (RAG). Sarjana thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text (COVER)
COVER.pdf

Download (177kB) | Preview
[img]
Preview
Text (ABSTRAK)
ABSTRAK.pdf

Download (189kB) | Preview
[img]
Preview
Text (SURAT PERNYATAAN KARYA SENDIRI)
SURAT PERNYATAAN KARYA SENDIRI.pdf

Download (408kB) | Preview
[img]
Preview
Text (DAFTAR ISI)
DAFTAR ISI.pdf

Download (271kB) | Preview
[img]
Preview
Text (BAB I)
BAB I.pdf

Download (326kB) | Preview
[img] Text (BAB II)
BAB II.pdf
Restricted to Registered users only

Download (372kB)
[img] Text (BAB III)
BAB III.pdf
Restricted to Registered users only

Download (345kB)
[img] Text (BAB IV)
BAB IV.pdf
Restricted to Registered users only

Download (357kB)
[img] Text (BAB V)
BAB V.pdf
Restricted to Registered users only

Download (234kB)
[img] Text (DAFTAR PUSTAKA)
DAFTAR PUSTAKA.pdf
Restricted to Registered users only

Download (204kB)
[img] Text (LAMPIRAN)
LAMPIRAN.pdf
Restricted to Repository staff only

Download (280kB)

Abstract

Perkembangan Large Language Models (LLM) telah memberikan kemajuan signifikan pada sistem chatbot, namun permasalahan hallucination jawaban yang terdengar meyakinkan namun tidak faktual masih menjadi tantangan utama. Penelitian ini bertujuan mengoptimalkan chatbot berbasis LLM melalui integrasi Retrieval-Augmented Generation (RAG) dan web search untuk mengurangi hallucination serta meningkatkan relevansi dan akurasi jawaban. Model LLaMA 3 dilakukan fine-tuning menggunakan dataset berbahasa Indonesia pada domain web programming. Sumber pengetahuan eksternal diperoleh melalui proses web scraping menggunakan Firecrawl, yang kemudian diindeks pada vector store untuk mendukung pencarian berbasis semantic search. Sistem dirancang dengan alur end-to-end yang memadukan tahap retrieval, grading dokumen, dan generation. Evaluasi dilakukan menggunakan metrik BERTScore terhadap 200 pertanyaan uji. Hasil pengujian menunjukkan peningkatan performa signifikan pada model LLM+RAG dibandingkan LLM murni, dengan nilai F1-score meningkat dari 0,5729 menjadi 0,6928. Integrasi RAG dan web search terbukti efektif dalam mengurangi hallucination dan menghasilkan jawaban yang lebih faktual serta kontekstual.

Item Type: Thesis (Sarjana)
Uncontrolled Keywords: large language models; chatbot; retrieval-augmented generation; hallucination
Subjects: Special Computer Methods > Artificial Intelligence
Divisions: Fakultas Sains dan Teknologi > Program Studi Teknik Informatika
Depositing User: Muhammad Fakhri Fakhruddin
Date Deposited: 01 Sep 2025 00:43
Last Modified: 01 Sep 2025 00:43
URI: https://digilib.uinsgd.ac.id/id/eprint/116903

Actions (login required)

View Item View Item