Ramadita, Ray (2025) SEQURAN: Composite scoring and reranking techniques for refining Quran search engine result. Sarjana thesis, UIN Sunan Gunung Djati Bandung.
| 
 | Text 1_cover.pdf Download (131kB) | Preview | |
| 
 | Text 2_abstrak.pdf Download (796kB) | Preview | |
| 
 | Text 3_skbebasplagiarism.pdf Download (359kB) | Preview | |
| 
 | Text 4_daftarisi.pdf Download (747kB) | Preview | |
| 
 | Text 5_bab1.pdf Download (2MB) | Preview | |
| ![[img]](https://digilib.uinsgd.ac.id/style/images/fileicons/text.png) | Text 6_bab2.pdf Restricted to Registered users only Download (5MB) | Request a copy | |
| ![[img]](https://digilib.uinsgd.ac.id/style/images/fileicons/text.png) | Text 7_bab3.pdf Restricted to Registered users only Download (3MB) | Request a copy | |
| ![[img]](https://digilib.uinsgd.ac.id/style/images/fileicons/text.png) | Text 8_bab4.pdf Restricted to Registered users only Download (2MB) | Request a copy | |
| ![[img]](https://digilib.uinsgd.ac.id/style/images/fileicons/text.png) | Text 9_bab5.pdf Restricted to Registered users only Download (405kB) | Request a copy | |
| ![[img]](https://digilib.uinsgd.ac.id/style/images/fileicons/text.png) | Text 10_daftarpustaka.pdf Restricted to Registered users only Download (3MB) | Request a copy | 
Abstract
Sistem Information Retrieval (IR) sangat penting dalam pengembangan search engine yang akurat dan relevan, terutama pada aplikasi domain spesifik seperti Sequran. Meskipun fine-tuning merupakan pendekatan optimasi yang umum, metode ini seringkali memerlukan sumber daya komputasi yang besar, dataset yang beragam, dan hyperparameter tuning yang memakan waktu, dengan risiko penurunan performa. Untuk mengatasi tantangan tersebut, penelitian ini memperkenalkan dan mengevaluasi arsitektur baru yang meningkatkan relevansi pencarian dengan mengintegrasikan sinyal leksikal dan semantik, menawarkan alternatif praktis untuk fine-tuning yang membutuhkan sumber daya besar. Arsitektur yang diusulkan melibatkan proses dua tahap. Tahap pertama, composite scoring, meningkatkan frekuensi kata tradisional (BM25/S) dengan semantic intent booster untuk menghasilkan peringkat awal yang lebih bervariasi. Tahap kedua menggunakan arsitektur Cross-Encoder (jina-reranker-v2-base-multilingual) untuk refine peringkat hasil awal berdasarkan relevansi kontekstual yang lebih dalam. Evaluasi pada dataset spesifik pertanyaan-jawaban tentang Islam menunjukkan bahwa kombinasi ini (tanpa keyword extraction) menghasilkan hasil yang paling seimbang. Temuan menunjukkan peningkatan moderat namun konsisten pada berbagai metrik, seperti Precision@10 dan Recall@10, dengan peningkatan masing-masing 6.3% dan 14.1% dibandingkan dengan model dasar. Peningkatan ini melibatkan trade-off yang sangat jelas, karena waktu evaluasi total pada dataset meningkat menjadi 18.5 detik. Implikasi utama dari penelitian ini adalah validasi arsitektur praktis untuk meningkatkan sistem IR, menawarkan alternatif yang layak untuk konteks domain spesifik seperti Sequran.
| Item Type: | Thesis (Sarjana) | 
|---|---|
| Additional Information: | tidak ada lampiran | 
| Uncontrolled Keywords: | Composite Scoring; Information Retrieval; Reranking; Mesin Pencari; Quran | 
| Subjects: | Data Processing, Computer Science Special Computer Methods > Artificial Intelligence | 
| Divisions: | Fakultas Sains dan Teknologi > Program Studi Teknik Informatika | 
| Depositing User: | Ray Ramadita | 
| Date Deposited: | 25 Aug 2025 01:10 | 
| Last Modified: | 25 Aug 2025 01:10 | 
| URI: | https://digilib.uinsgd.ac.id/id/eprint/115786 | 
Actions (login required)
|  | View Item | 
 
        


