Studi komparatif IndoBERT dan IndoBERTweet dalam deteksi pesan ofensif berbahasa Indonesia pada platform Discord

Wiguna, Fajar Satria (2026) Studi komparatif IndoBERT dan IndoBERTweet dalam deteksi pesan ofensif berbahasa Indonesia pada platform Discord. Sarjana thesis, UIN Sunan Gunung Djati Bandung.

Full text not available from this repository. (Request a copy)

Abstract

Pesan ofensif berbahasa Indonesia dalam komunitas gaming Discord dapat memicu konflik verbal dan menciptakan lingkungan digital yang toksik. Penelitian ini membandingkan performa model IndoBERT (dengan adaptasi normalisasi slang pada preprocessing) dan IndoBERTweet dalam mendeteksi pesan ofensif pada teks informal yang merepresentasikan komunikasi real-time Discord periode 2025–2026. Metodologi CRISP-DM diterapkan dengan memanfaatkan dataset gabungan dari sumber publik dan simulasi sintetis, dengan total 45.450 sampel setelah pembersihan. Proses meliputi pembersihan teks, normalisasi slang selektif, tokenisasi WordPiece, penanganan ketidakseimbangan kelas melalui class weighting, serta fine-tuning pada tiga skema stratified split (60:20:20, 70:15:15, 80:10:10). Hasil evaluasi menunjukkan IndoBERTweet unggul secara konsisten, dengan macro F1-score tertinggi 0,8029 pada skema 70:15:15, sedangkan IndoBERT mencapai 0,6618 (selisih ≈12–14 poin persen). Keunggulan IndoBERTweet dipengaruhi oleh kesesuaian korpus pre-training yang berasal dari data media sosial, sehingga lebih mampu menangkap karakteristik bahasa informal Discord, termasuk slang gaming, code-mixing, sarkasme, dan trash talk. Penelitian ini menegaskan pentingnya pemilihan model yang selaras dengan domain teks informal dan merekomendasikan IndoBERTweet sebagai model utama untuk sistem moderasi AI pada komunitas gaming Indonesia.

Item Type: Thesis (Sarjana)
Additional Information: tidak ada lampiran
Uncontrolled Keywords: IndoBERT; IndoBERTweet; deteksi pesan ofensif; Discord; teks informal; NLP; CRISP-DM
Subjects: Data Processing, Computer Science
Data Processing, Computer Science > Systems Analysis and Computer Design
Special Computer Methods > Artificial Intelligence
Special Computer Methods > Online Social Network
Divisions: Fakultas Sains dan Teknologi > Program Studi Teknik Informatika
Depositing User: Fajar Satria Wiguna
Date Deposited: 07 Apr 2026 07:50
Last Modified: 07 Apr 2026 08:44
URI: https://digilib.uinsgd.ac.id/id/eprint/129526

Actions (login required)

View Item View Item