SEQURAN: Composite scoring and reranking techniques for refining Quran search engine result

Ramadita, Ray (2025) SEQURAN: Composite scoring and reranking techniques for refining Quran search engine result. Sarjana thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text
1_cover.pdf

Download (131kB) | Preview
[img]
Preview
Text
2_abstrak.pdf

Download (796kB) | Preview
[img]
Preview
Text
3_skbebasplagiarism.pdf

Download (359kB) | Preview
[img]
Preview
Text
4_daftarisi.pdf

Download (747kB) | Preview
[img]
Preview
Text
5_bab1.pdf

Download (2MB) | Preview
[img] Text
6_bab2.pdf
Restricted to Registered users only

Download (5MB) | Request a copy
[img] Text
7_bab3.pdf
Restricted to Registered users only

Download (3MB) | Request a copy
[img] Text
8_bab4.pdf
Restricted to Registered users only

Download (2MB) | Request a copy
[img] Text
9_bab5.pdf
Restricted to Registered users only

Download (405kB) | Request a copy
[img] Text
10_daftarpustaka.pdf
Restricted to Registered users only

Download (3MB) | Request a copy

Abstract

Sistem Information Retrieval (IR) sangat penting dalam pengembangan search engine yang akurat dan relevan, terutama pada aplikasi domain spesifik seperti Sequran. Meskipun fine-tuning merupakan pendekatan optimasi yang umum, metode ini seringkali memerlukan sumber daya komputasi yang besar, dataset yang beragam, dan hyperparameter tuning yang memakan waktu, dengan risiko penurunan performa. Untuk mengatasi tantangan tersebut, penelitian ini memperkenalkan dan mengevaluasi arsitektur baru yang meningkatkan relevansi pencarian dengan mengintegrasikan sinyal leksikal dan semantik, menawarkan alternatif praktis untuk fine-tuning yang membutuhkan sumber daya besar. Arsitektur yang diusulkan melibatkan proses dua tahap. Tahap pertama, composite scoring, meningkatkan frekuensi kata tradisional (BM25/S) dengan semantic intent booster untuk menghasilkan peringkat awal yang lebih bervariasi. Tahap kedua menggunakan arsitektur Cross-Encoder (jina-reranker-v2-base-multilingual) untuk refine peringkat hasil awal berdasarkan relevansi kontekstual yang lebih dalam. Evaluasi pada dataset spesifik pertanyaan-jawaban tentang Islam menunjukkan bahwa kombinasi ini (tanpa keyword extraction) menghasilkan hasil yang paling seimbang. Temuan menunjukkan peningkatan moderat namun konsisten pada berbagai metrik, seperti Precision@10 dan Recall@10, dengan peningkatan masing-masing 6.3% dan 14.1% dibandingkan dengan model dasar. Peningkatan ini melibatkan trade-off yang sangat jelas, karena waktu evaluasi total pada dataset meningkat menjadi 18.5 detik. Implikasi utama dari penelitian ini adalah validasi arsitektur praktis untuk meningkatkan sistem IR, menawarkan alternatif yang layak untuk konteks domain spesifik seperti Sequran.

Item Type: Thesis (Sarjana)
Additional Information: tidak ada lampiran
Uncontrolled Keywords: Composite Scoring; Information Retrieval; Reranking; Mesin Pencari; Quran
Subjects: Data Processing, Computer Science
Special Computer Methods > Artificial Intelligence
Divisions: Fakultas Sains dan Teknologi > Program Studi Teknik Informatika
Depositing User: Ray Ramadita
Date Deposited: 25 Aug 2025 01:10
Last Modified: 25 Aug 2025 01:10
URI: https://digilib.uinsgd.ac.id/id/eprint/115786

Actions (login required)

View Item View Item