Maulana, Rifky (2025) Perbandingan algoritma Latent Dirichlet Allocation (LDA) dan BERTopic dalam pemodelan topik pada X. Sarjana thesis, UIN Sunan Gunung Djati Bandung.
|
Text (COVER)
1_cover.pdf Download (67kB) | Preview |
|
|
Text (ABSTRAK)
2_abstrak.pdf Download (192kB) | Preview |
|
|
Text (DAFTAR ISI)
3_daftarisi.pdf Download (265kB) | Preview |
|
|
Text (BAB I)
4_bab1.pdf Download (286kB) | Preview |
|
![]() |
Text (BAB II)
5_bab2.pdf Restricted to Registered users only Download (307kB) | Request a copy |
|
![]() |
Text (BAB III)
6_bab3.pdf Restricted to Registered users only Download (4MB) | Request a copy |
|
![]() |
Text (BAB IV)
7_bab4.pdf Restricted to Registered users only Download (318kB) | Request a copy |
|
![]() |
Text (BAB V)
8_bab5.pdf Restricted to Registered users only Download (191kB) | Request a copy |
|
![]() |
Text (DAFTAR PUSTAKA)
9_daftarpustaka.pdf Restricted to Registered users only Download (211kB) | Request a copy |
|
![]() |
Text (LAMPIRAN)
10_lampiran.pdf Restricted to Repository staff only Download (167kB) | Request a copy |
Abstract
Perbandingan algoritma Latent Dirichlet Allocation (LDA) dan BERTopic dilakukan untuk mengevaluasi efektivitas kedua metode dalam pemodelan topik pada kumpulan postingan media sosial X terkait Piala Asia U-23 2024. Penelitian ini bertujuan untuk mengidentifikasi algoritma yang lebih unggul dalam menghasilkan topik yang koheren, relevan, dan beragam berdasarkan metrik Topic Coherence dan Topic Diversity. Proses penelitian menggunakan pendekatan Knowledge Discovery in Database (KDD), meliputi pengumpulan 1.570 data cuitan dengan kata kunci #TimnasDay, pra-pemrosesan data, dan penerapan kedua algoritma pada data yang telah disiapkan. Hasil menunjukkan bahwa BERTopic unggul dalam Topic Coherence dengan skor 0,515 dibandingkan LDA yang mencapai skor tertinggi 0,439 pada variasi parameter tertentu. Selain itu, BERTopic menghasilkan Topic Diversity lebih tinggi (0,98) dibandingkan LDA (0,88–0,89). Berdasarkan evaluasi manual, BERTopic juga lebih efektif dalam menangkap konteks semantik dan menghasilkan topik yang lebih bermakna. Temuan ini mengindikasikan bahwa BERTopic lebih cocok untuk pemodelan topik pada data teks pendek seperti cuitan media sosial.
Item Type: | Thesis (Sarjana) |
---|---|
Uncontrolled Keywords: | X; Data Teks Pendek; LDA; BERTopic; Pemodelan Topik; Perbandingan Algoritma; Koherensi Topik; Keberagaman Topik |
Subjects: | Data Processing, Computer Science > Computer and Human Data Processing, Computer Science > Nonelectronic Data Processing Numerical Analysis > Algorithms |
Divisions: | Fakultas Sains dan Teknologi > Program Studi Teknik Informatika |
Depositing User: | Rifky Maulana |
Date Deposited: | 26 Feb 2025 03:15 |
Last Modified: | 26 Feb 2025 03:15 |
URI: | https://digilib.uinsgd.ac.id/id/eprint/104820 |
Actions (login required)
![]() |
View Item |