Analisis Kinerja dan Evaluasi Model Text-to-Speech Bahasa Indonesia Berbasis FastSpecch2

Firdaus, Muhammad Raihan (2026) Analisis Kinerja dan Evaluasi Model Text-to-Speech Bahasa Indonesia Berbasis FastSpecch2. Sarjana thesis, UIN Sunan Gunung Djati Bandung.

Full text not available from this repository. (Request a copy)

Abstract

Skor literasi Indonesia dinilai rendah (359) oleh Programme for International Student Assessment (PISA) dan menunjukkan akan adanya masalah terkait sumber daya manusia dalam mewujudkan visi Indonesia Emas 2045. Konsumsi video pendek menjadi juga sedang populer yang menambah penyebab turunnya literasi sedangkan audiobook sebagai media potensial untuk bersaing juga masih kurang dalam bahasa Indonesia. Dalam mengatasi keterbatasan tersebut, teknologi Text-to Speech (TTS) berbasis Deep Learning dapat digunakan sebagai solusi yang efisien. Penelitian ini akan menggunakan arsitektur FastSpeech2 yang masih jarang diteliti dalam konteks bahasa Indonesia dan menjadikan penelitian berfokus pada analisis kinerja dan evaluasi. Metodologi penelitian mengadopsi CRISP-DM dengan beberapa penyesuaian. Dimulai dari data yang terkumpul sebanyak 1980 pasang audio dan teks berdurasi 3.93 jam dan dilanjutkan dengan Forced Alignment (FA). Kemudian training dilakukan dengan menggunakan dua konfigurasi model (FS1 dan FS2). Hasil penelitian menunjukkan model hanya dapat melafalkan 6.5-7% dari jumlah kata input dan 31% durasi audio dibandingkan referensi, serta nilai Mel Cepstral Distortion (MCD) lebih dari 450dB. Analisis menunjukkan bahwa kuantitas dataset dan sumber daya alignment menjadi kendala utama kinerja model, bukan pada sisi vocoder. Hal ini dibuktikan melalui Oracle Test (Ground Truth) yang mencapai 78% keterbacaan dan 81% kesamaan durasi, menandakan potensi model dapat ditingkatkan dengan optimasi ketersediaan data dan sumber daya untuk proses Forced Alignment.

Item Type: Thesis (Sarjana)
Uncontrolled Keywords: Bahasa Indonesia; Deep Learning; FastSpeech2; Literasi; Text-to-Speech (TTS);
Subjects: Engineering
Applied Physics > Computer Engineering
Divisions: Fakultas Sains dan Teknologi > Program Studi Teknik Informatika
Depositing User: Muhammad Raihan Firdaus
Date Deposited: 14 Apr 2026 07:41
Last Modified: 14 Apr 2026 07:41
URI: https://digilib.uinsgd.ac.id/id/eprint/129840

Actions (login required)

View Item View Item