Perbandingan algoritma Latent Dirichlet Allocation (LDA) dan BERTopic dalam pemodelan topik pada X

Maulana, Rifky (2025) Perbandingan algoritma Latent Dirichlet Allocation (LDA) dan BERTopic dalam pemodelan topik pada X. Sarjana thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text (COVER)
1_cover.pdf

Download (67kB) | Preview
[img]
Preview
Text (ABSTRAK)
2_abstrak.pdf

Download (192kB) | Preview
[img]
Preview
Text (DAFTAR ISI)
3_daftarisi.pdf

Download (265kB) | Preview
[img]
Preview
Text (BAB I)
4_bab1.pdf

Download (286kB) | Preview
[img] Text (BAB II)
5_bab2.pdf
Restricted to Registered users only

Download (307kB) | Request a copy
[img] Text (BAB III)
6_bab3.pdf
Restricted to Registered users only

Download (4MB) | Request a copy
[img] Text (BAB IV)
7_bab4.pdf
Restricted to Registered users only

Download (318kB) | Request a copy
[img] Text (BAB V)
8_bab5.pdf
Restricted to Registered users only

Download (191kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
9_daftarpustaka.pdf
Restricted to Registered users only

Download (211kB) | Request a copy
[img] Text (LAMPIRAN)
10_lampiran.pdf
Restricted to Repository staff only

Download (167kB) | Request a copy

Abstract

Perbandingan algoritma Latent Dirichlet Allocation (LDA) dan BERTopic dilakukan untuk mengevaluasi efektivitas kedua metode dalam pemodelan topik pada kumpulan postingan media sosial X terkait Piala Asia U-23 2024. Penelitian ini bertujuan untuk mengidentifikasi algoritma yang lebih unggul dalam menghasilkan topik yang koheren, relevan, dan beragam berdasarkan metrik Topic Coherence dan Topic Diversity. Proses penelitian menggunakan pendekatan Knowledge Discovery in Database (KDD), meliputi pengumpulan 1.570 data cuitan dengan kata kunci #TimnasDay, pra-pemrosesan data, dan penerapan kedua algoritma pada data yang telah disiapkan. Hasil menunjukkan bahwa BERTopic unggul dalam Topic Coherence dengan skor 0,515 dibandingkan LDA yang mencapai skor tertinggi 0,439 pada variasi parameter tertentu. Selain itu, BERTopic menghasilkan Topic Diversity lebih tinggi (0,98) dibandingkan LDA (0,88–0,89). Berdasarkan evaluasi manual, BERTopic juga lebih efektif dalam menangkap konteks semantik dan menghasilkan topik yang lebih bermakna. Temuan ini mengindikasikan bahwa BERTopic lebih cocok untuk pemodelan topik pada data teks pendek seperti cuitan media sosial.

Item Type: Thesis (Sarjana)
Uncontrolled Keywords: X; Data Teks Pendek; LDA; BERTopic; Pemodelan Topik; Perbandingan Algoritma; Koherensi Topik; Keberagaman Topik
Subjects: Data Processing, Computer Science > Computer and Human
Data Processing, Computer Science > Nonelectronic Data Processing
Numerical Analysis > Algorithms
Divisions: Fakultas Sains dan Teknologi > Program Studi Teknik Informatika
Depositing User: Rifky Maulana
Date Deposited: 26 Feb 2025 03:15
Last Modified: 26 Feb 2025 03:15
URI: https://digilib.uinsgd.ac.id/id/eprint/104820

Actions (login required)

View Item View Item