Algoritma Image Processing untuk Optimalisasi Optical Character Recognition (OCR) dengan Engine Tesseract pada Karakter Arab

Gilang Surahman H, Gilang (2016) Algoritma Image Processing untuk Optimalisasi Optical Character Recognition (OCR) dengan Engine Tesseract pada Karakter Arab. Diploma thesis, UIN Sunan Gunung Djati Bandung.

[img]
Preview
Text (COVER)
1_cover.pdf

Download (14kB) | Preview
[img]
Preview
Text (ABSTRAK)
2_abstrak.pdf

Download (7kB) | Preview
[img]
Preview
Text (DAFTAR ISI)
3_daftarisi.pdf

Download (15kB) | Preview
[img]
Preview
Text (BAB I)
4_bab1.pdf

Download (118kB) | Preview
[img] Text (BAB II)
5_bab2.pdf
Restricted to Registered users only

Download (636kB)
[img] Text (BAB III)
6_bab3.pdf
Restricted to Registered users only

Download (993kB)
[img] Text (BAB IV)
7_bab4.pdf
Restricted to Registered users only

Download (642kB)
[img] Text (BAB V)
8_bab5.pdf
Restricted to Registered users only

Download (88kB)
[img] Text (DAFTAR PUSTAKA)
9_daftarpustaka.pdf
Restricted to Registered users only

Download (86kB)

Abstract

Ada banyak software Optical Character Recognition (OCR) pada perangkat mobile yang mendukung pembacaan karakter Arab dan bekerja dengan baik seperti Asprise, ABBYY's, Tesseract, dsb. Hanya saja tidak banyak yang menyediakan layanan open source dan gratis. Tesseract merupakan salah satu engine OCR yang menyediakan layanan open source dan juga gratis. Dari hasil studi empiris yang dilakukan engine Tesseract memiliki kekurangan yaitu pada sisi akurasi khususnya pada karakter Arab. Untuk memperbaiki tingkat akurasi tersebut dibutuhkan algoritma image preprocessing sebelum masuk ke engine Tesseract. Pada penelitian ini dilakukan modifikasi dengan menambahkan metode resize dengan algoritma Nearest Neighbor Interpolation dan merubah citra menjadi grayscale dengan algoritma Luminosity. Pengujian dilakukan dengan pendekatan kotak hitam (black box) untuk menguji masing-masing fungsionalitas sistem. Setelah pengujian berhasil dilakukan, maka dapat disimpulkan bahwa penambahan algoritma image preprocessing, yaitu Nearest Neighbor Interpolation dan Luminosity dapat memperbaiki hasil OCR berdasarkan hasil pengujian sebanyak tujuh kali percobaan dengan masing-masing percobaan diuji dua kali untuk karakter latin dan tiga kali untuk karakter arab dengan jarak foto yang berbeda dengan peningkatan akurasi sebesar 6,67%.

Item Type: Thesis (Diploma)
Uncontrolled Keywords: Tesseract, OCR, Karakter Arab, Algoritma Nearest Neighbor Interpolation, Algoritma Luminosity
Subjects: Applied Physics
Applied Physics > Computer Engineering
Divisions: Fakultas Sains dan Teknologi > Program Studi Teknik Informatika
Depositing User: Sopia Respiawati
Date Deposited: 05 Oct 2017 06:39
Last Modified: 05 Oct 2017 06:39
URI: http://digilib.uinsgd.ac.id/id/eprint/4441

Actions (login required)

View Item View Item