Ramadita, Ray (2025) SEQURAN: Composite scoring and reranking techniques for refining Quran search engine result. Sarjana thesis, UIN Sunan Gunung Djati Bandung.
|
Text
1_cover.pdf Download (131kB) | Preview |
|
|
Text
2_abstrak.pdf Download (796kB) | Preview |
|
|
Text
3_skbebasplagiarism.pdf Download (359kB) | Preview |
|
|
Text
4_daftarisi.pdf Download (747kB) | Preview |
|
|
Text
5_bab1.pdf Download (2MB) | Preview |
|
![]() |
Text
6_bab2.pdf Restricted to Registered users only Download (5MB) | Request a copy |
|
![]() |
Text
7_bab3.pdf Restricted to Registered users only Download (3MB) | Request a copy |
|
![]() |
Text
8_bab4.pdf Restricted to Registered users only Download (2MB) | Request a copy |
|
![]() |
Text
9_bab5.pdf Restricted to Registered users only Download (405kB) | Request a copy |
|
![]() |
Text
10_daftarpustaka.pdf Restricted to Registered users only Download (3MB) | Request a copy |
Abstract
Sistem Information Retrieval (IR) sangat penting dalam pengembangan search engine yang akurat dan relevan, terutama pada aplikasi domain spesifik seperti Sequran. Meskipun fine-tuning merupakan pendekatan optimasi yang umum, metode ini seringkali memerlukan sumber daya komputasi yang besar, dataset yang beragam, dan hyperparameter tuning yang memakan waktu, dengan risiko penurunan performa. Untuk mengatasi tantangan tersebut, penelitian ini memperkenalkan dan mengevaluasi arsitektur baru yang meningkatkan relevansi pencarian dengan mengintegrasikan sinyal leksikal dan semantik, menawarkan alternatif praktis untuk fine-tuning yang membutuhkan sumber daya besar. Arsitektur yang diusulkan melibatkan proses dua tahap. Tahap pertama, composite scoring, meningkatkan frekuensi kata tradisional (BM25/S) dengan semantic intent booster untuk menghasilkan peringkat awal yang lebih bervariasi. Tahap kedua menggunakan arsitektur Cross-Encoder (jina-reranker-v2-base-multilingual) untuk refine peringkat hasil awal berdasarkan relevansi kontekstual yang lebih dalam. Evaluasi pada dataset spesifik pertanyaan-jawaban tentang Islam menunjukkan bahwa kombinasi ini (tanpa keyword extraction) menghasilkan hasil yang paling seimbang. Temuan menunjukkan peningkatan moderat namun konsisten pada berbagai metrik, seperti Precision@10 dan Recall@10, dengan peningkatan masing-masing 6.3% dan 14.1% dibandingkan dengan model dasar. Peningkatan ini melibatkan trade-off yang sangat jelas, karena waktu evaluasi total pada dataset meningkat menjadi 18.5 detik. Implikasi utama dari penelitian ini adalah validasi arsitektur praktis untuk meningkatkan sistem IR, menawarkan alternatif yang layak untuk konteks domain spesifik seperti Sequran.
Item Type: | Thesis (Sarjana) |
---|---|
Additional Information: | tidak ada lampiran |
Uncontrolled Keywords: | Composite Scoring; Information Retrieval; Reranking; Mesin Pencari; Quran |
Subjects: | Data Processing, Computer Science Special Computer Methods > Artificial Intelligence |
Divisions: | Fakultas Sains dan Teknologi > Program Studi Teknik Informatika |
Depositing User: | Ray Ramadita |
Date Deposited: | 25 Aug 2025 01:10 |
Last Modified: | 25 Aug 2025 01:10 |
URI: | https://digilib.uinsgd.ac.id/id/eprint/115786 |
Actions (login required)
![]() |
View Item |