Deteksi bahasa kasar pada konten podcast YouTube menggunakan algoritma Bidirectional Encoder Representations from Transformers

Nurtamami, Ighna (2025) Deteksi bahasa kasar pada konten podcast YouTube menggunakan algoritma Bidirectional Encoder Representations from Transformers. Sarjana thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text (COVER)
1_cover.pdf

Download (51kB) | Preview
[img]
Preview
Text (ABSTRAK)
2_abstrak.pdf

Download (22kB) | Preview
[img]
Preview
Text (DAFTAR ISI)
3_daftarisi.pdf

Download (51kB) | Preview
[img]
Preview
Text (BAB I)
4_bab1.pdf

Download (136kB) | Preview
[img] Text (BAB II)
5_bab2.pdf
Restricted to Registered users only

Download (368kB) | Request a copy
[img] Text (BAB III)
6_bab3.pdf
Restricted to Registered users only

Download (306kB) | Request a copy
[img] Text (BAB IV)
7_bab4.pdf
Restricted to Registered users only

Download (659kB) | Request a copy
[img] Text (BAB V)
8_bab5.pdf
Restricted to Registered users only

Download (25kB) | Request a copy
[img] Text (DAFTAR PUSTAKA)
9_daftarpustaka.pdf
Restricted to Registered users only

Download (107kB) | Request a copy
[img] Text (LAMPIRAN)
10_lampiran.pdf
Restricted to Repository staff only

Download (53kB) | Request a copy

Abstract

Penggunaan media digital seperti YouTube semakin meningkat, termasuk podcast yang menyajikan berbagai topik. Namun, percakapan dalam podcast sering kali mengandung bahasa kasar yang dapat menimbulkan ketidaknyamanan bagi pendengar. Penelitian ini bertujuan mendeteksi bahasa kasar dalam konten podcast youtube menggunakan algoritma BERT dengan metodologi CRISP-DM. Dataset terdiri dari transkrip 13 video, dengan penanganan ketidakseimbangan data menggunakan SMOTE. Model BERT mencapai performa optimal pada pembagian data 80:20 dan 3 epoch, dengan Precision, Recall, dan F1-Score sempurna sebesar 1.00, serta BERTScore F1 sebesar 0.829. Penelitian ini juga menghasilkan prototipe aplikasi berbasis web yang secara otomatis memproses transkrip video youtube, mendeteksi bahasa kasar, dan menampilkan hasil analisis. Hasil penelitian ini berkontribusi dalam pengembangan teknologi analisis teks berbasis machine learning untuk menciptakan komunikasi digital yang lebih kondusif.

Item Type: Thesis (Sarjana)
Uncontrolled Keywords: podcast youtube; Algoritma BERT; SMOTE
Subjects: Data Processing, Computer Science
Data Processing, Computer Science > Computer Science Education
Data Processing, Computer Science > Processing Modes
Divisions: Fakultas Sains dan Teknologi > Program Studi Teknik Informatika
Depositing User: Ighna Nurtamami
Date Deposited: 03 Mar 2025 06:01
Last Modified: 03 Mar 2025 06:01
URI: https://digilib.uinsgd.ac.id/id/eprint/105117

Actions (login required)

View Item View Item