Similarity nama produk dengan kesalahan penulisan pada platform donasi menggunakan model Siamese Long Short Term Memory

Thoriq, Muhammad (2025) Similarity nama produk dengan kesalahan penulisan pada platform donasi menggunakan model Siamese Long Short Term Memory. Sarjana thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text (Halaman Judul)
Halaman judul.pdf

Download (170kB) | Preview
[img]
Preview
Text (Daftar Isi)
Daftar isi.pdf

Download (193kB) | Preview
[img]
Preview
Text (Keterangan Bebas Plagiarisme)
Keterangan Bebas Plagiarisme.pdf

Download (439kB) | Preview
[img]
Preview
Text (Abstrak)
abstrack.pdf

Download (193kB) | Preview
[img] Text (Bab 2)
Bab 2.pdf
Restricted to Registered users only

Download (406kB)
[img] Text (Bab 1)
Bab 1.pdf
Restricted to Registered users only

Download (270kB)
[img] Text (Bab 3)
Bab 3.pdf
Restricted to Registered users only

Download (323kB)
[img] Text (Bab 4)
Bab 4.pdf
Restricted to Registered users only

Download (861kB)
[img] Text (Bab 5)
Bab 5.pdf
Restricted to Registered users only

Download (174kB)
[img] Text (Daftar pustaka)
Daftar pustaka.pdf
Restricted to Registered users only

Download (198kB)
[img] Text (Lampiran)
Lampiran].pdf
Restricted to Repository staff only

Download (4MB)

Abstract

Penelitian ini dilakukan untuk mengatasi permasalahan dalam mendeteksi kemiripan nama produk atau merek yang mengalami kesalahan ejaan (typo), termasuk bentuk ejaan tidak baku seperti leetspeak, dalam teks tidak terstruktur pada platform donasi digital. Dalam konteks digital, kesalahan penulisan seperti penggantian huruf dengan angka atau simbol (misalnya “45us” untuk “asus”) umum terjadi dan dapat menghambat proses identifikasi entitas secara otomatis. Oleh karena itu, penelitian ini bertujuan untuk menerapkan arsitektur Siamese dengan Shared LSTM Encoder dalam mendeteksi kemiripan kata, khususnya untuk mengidentifikasi nama merek atau produk yang disengaja melakukan typo pada penulisanya. Metode yang digunakan melibatkan arsitektur jaringan saraf berbasis LSTM yang membandingkan pasangan kata melalui encoder berbobot sama (shared weights), sehingga mampu mengenali pola kemiripan meskipun terjadi variasi penulisan, termasuk leetspeak dan typo informal lainnya. Hasil evaluasi menunjukkan performa yang sangat baik, dengan akurasi, presisi, recall, dan F1-score hampir mencapai 100% pada data uji. Temuan ini membuktikan bahwa pendekatan yang diusulkan sangat efektif untuk menyelesaikan permasalahan typo dan variasi penulisan kreatif pada entitas merek, serta dapat diandalkan sebagai bagian dari sistem validasi konten dalam platform digital.

Item Type: Thesis (Sarjana)
Uncontrolled Keywords: Deteksi Kemiripan Kata,;Typo; Leetspeak,;Siamese Network; LSTM, Platform Donasi
Subjects: Data Processing, Computer Science
Divisions: Fakultas Sains dan Teknologi > Program Studi Teknik Informatika
Depositing User: Muhammad Thoriq
Date Deposited: 19 Sep 2025 04:16
Last Modified: 19 Sep 2025 04:18
URI: https://digilib.uinsgd.ac.id/id/eprint/120253

Actions (login required)

View Item View Item