Metode Feature Extraction untuk Character Recognition

(1)

Metode Feature Extraction untuk

Character Recognition

1 Pendahuluan

1.1 Posisi Feature Extraction

Feature extraction merupakan tahap terpenting dalam sistem character recognition. Sistem Optical Character Recognition (OCR) biasanya memiliki tahapan pemrosesan sebagai berikut:

1. Gray-level scanning dalam resolusi tertentu, biasanya 300 – 1000 dots/inch. 2. Preprocessing

a. Binarization (two-level thresholding), baik dengan metode global atau adaptif (lokal) b. Segmentation, untuk mengisolasi individual character.

c. Konversi ke dalam representasi lain, misalnya skeleton atau contour (optional). 3. Feature extraction

4. Classification

(3)

1.2 Representasi Karakter

Suatu karakter dapat memiliki representasi yang berbeda-beda. Terhadap masing-masing representasi dapat dilakukan metode feature extraction yang berbeda-beda. Beberapa representasi tersebut antara lain:

1. Gray-scale subimage 2. Binary: solid, contour 3. Skeleton (vector)

1.3 Invariant

Satu karakter dapat memiliki berbagai variasi. Karena itu dibutuhkan fitur yang memiliki nilai sama pada beragam variasi tersebut. Fitur seperti itu dinamakan invariant. Beberapa variasi yang mungkin dilakukan:  Rotation  Scaling  Stretched  Skewing  Mirrored

Jika fitur invariant tidak dapat ditemukan, alternatifnya adalah dengan melakukan normalization sehingga memiliki standar size, rotation, contrast, dll. Namun perlu diingat bahwa cara ini akan menghasilkan discretization error.

(4)

1.4 Reconstructability

Untuk beberapa metode feature extraction, character dapat direkonstruksi dengan menggunakan fitur yang tersedia. Dengan merekonstruksi karakter, dapat dilakukan pengecekan secara visual apakah fitur yang digunakan sudah cukup atau belum.

2 Metode Feature Extraction

2.1 Tipe Feature Extraction

Terdapat beberapa tipe berdasarkan pendekatannya: 1. Statistical a. Template Matching b. Deformable Template c. Projection Histogram d. Zoning e. Contour Profile

f. Spline Curve Approximation 2. Stuctural: Discrete Features

3. Transformation & Descriptor a. Unitary image transforms b. Geometric Moment c. Zernike Moment d. Fourier Descriptor

2.2 Gray-Scale Image

2.2.1 Template Matching

Metode ini sudah lama ditinggalkan oleh sistem OCR modern. Metode ini sebenarnya tidak melakukan feature extraction, melainkan image itu sendirilah yang menjadi fiturnya (dalam besaran Energy). Yang dilakukan hanyalah menyesuaikan ukuran image sehingga sama dengan template. Template yang menghasilkan similarity terbesar atau di atas threshold akan dianggap sebagai kelas hasil klasifikasi. Metode ini memiliki kekurangan:

1. Hanya dapat mengenali image dengan ukuran dan rotasi yang sama. 2. Hanya dapat dilakukan pada tingkat contrast dan grey level tertentu 3. Rentan terhadap noise dan variasi karakter

4. Menggunakan beberapa template untuk satu kelas dapat dilakukan, namun sangat tidak efisien.

2.2.2 Deformable Templates

Metode ini menggunakan template berupa kontur, skeleton, dll dari suatu kelas karakter. Sebuah image target ditransformasi agar sesuai dengan template (perubahan ukuran, edge detection, dll), kemudian

(5)

template tersebut dideformasi sedemikian rupa sehingga mencapai bentuk yang paling mendekati image target. Berdasarkan deformasi tersebut, nilai similarity dihitung.

2.2.3 Unitary Image Transforms

Pada template matching, seluruh pixel digunakan sebagai fitur. Tujuan unitary image transform adalah mengurangi jumlah fitur dengan tetap menjaga informasi penting dari bentuk karakter. Dengan transformasi ini, pixel diurutkan berdasarkan variansinya kemudian pixel yang memiliki nilai variansi tertinggi digunakan sebagai fitur. Contoh transformasi: Karhunen-Loeve (KL), Fourier, Hadamard, dan Haar.

Kelebihan:

1. Mengurangi jumlah fitur dan komputasi

2. Dapat dilakukan inverse-transform sehingga image awal dapat direkonstruksi. Kekurangan:

1. Not rotation-invariant

2. Input image harus memiliki ukuran yang persis sama 3. Not illumination-invariant

2.2.4 Zoning

Image dibagi ke dalam n x m grid. Kemudian, untuk setiap sel, nilai rata-rata gray-level dihitung. Dari sana, dihasilkan fitur vektor dengan n x m buah komponen. Fitur yang dihasilkan tidak illumination-invariant.

(6)

2.2.5 Geometric Moment Invariants

Image direpresentasikan dengan menggunakan konsep matematika yang disebut geometric moment. Dengan menggunakan konsep ini, fitur yang dihasilkan bersifat translation-, scale-, dan rotation-invariant.

2.2.6 Zernike Moments

Image direpresentasikan dengan menggunakan konsep matematika yang disebut Zernike moment

2.3 Binary Image

Binary image merupakan simplifikasi dari gray-scale image yang dihasilkan melalui binarization, baik metode global maupun adaptif. Disebut simplifikasi karena hanya terdapat range nilai 0 dan 1, dan bukannya 0 – 255. Pada binary image, semua invariant masih relevan kecuali illumination.

Solid binary character dapat dikonversi ke dalam bentuk representasi lain: outer contour, contour profile, skeleton, dll. Dalam konteks sistem OCR, tujuan dilakukan konversi adalah untuk mengambil informasi yang relevan dan menghilangkan informasi yang kurang relevan untuk mengenali bentuk karakter.

2.3.1 Template Matching 2.3.2 Projection Histogram

Metode ini dilakukan dengan melakukan proyeksi horizontal dan atau vertical terhadap image. Untuk proyeksi horizontal, y(xi) merupakan jumlah pixel dimana x = xi. Proyeksi histogram sangat sensitive

(7)

terhadap rotasi. Proeyeksi vertical invariant terhadap kemiringan, namun tidak dengan proyeksi horizontal.

Saat ini, teknik tersebut banyak digunakan untuk segmentasi karakter, kata, dan baris. Selain itu, digunakan pula untuk mendeteksi apakah input dari scanner terotasi atau tidak. Sebagai variasi, terdapat pula radial projection.

2.3.3 Zoning

Metode zoning pada binary image digunakan untuk menjawab permasalahan karakter text-printed yang terdegradasi, sehingga menyebabkan, misalnya self-touching. Baik contour extraction maupun thinning terbukti tidak dapat menyelesaikan permsalahan tersebut sebagaimana ditunjukkan pada gambar di bawah ini. Zoning digunakan untuk menghitung jumlah pixel hitam pada suatu zona tertentu.

(8)

2.3.4 Geometric Moment Invariants

Metode ini sama dengan pada gray-scale image, hanya saja dipandang sebagai kasus khusus dimana skalanya hanya 0 dan 1. Berdasarkan studi Belkasim yang membandingkan Hu, Barnieh, Zernike, Teague-Zernike, dan pseudo-Teague-Zernike, menggunakan kNN classifier, dihasilkan bahwa Zernike-lah yang memberikan hasil terbaik.

2.4 Binary Contour

2.4.1 Contour Profile

Metode ini menghitung jarak (pixel) antara bounding box dengan edge dari karakter. Metode ini menggambarkan dengan baik bentuk eksternal dari karakter. Metode ini dengan sendirinya bergantung kepada rotasi.

Sebagai variasi, terdapat pula radial out-in dan in-out profile seperti gambar di bawah ini

2.4.2 Zoning

Zoning pada binary contour sama dengan pada binary image, hanya saja pada setiap sel dihitung jumlah segmen dari sequence contour berdasarkan orientasinya.

(9)

2.4.3 Spline Curve Approximation

Metode ini mengidentifikasi titik-titik pada kontur dimana terjadi lengkungan yang tajam. Titik tersebut dinamakan break point. Antar break point tersebut dibentuk kurva dengan fungsi spline. Kemudian, breakpoints dan parameter dari kurva spline dijadikan fitur.

(10)

2.4.4 Elliptic Fourier Descriptor

2.5 Vector Represetation (Skeleton)

2.5.1 Template Matching 2.5.2 Deformable Templates

Template dideformasikan dengan menggunakan small steps yang disebut local affine transform (LAT) untuk agar cocok dengan skeleton input. Jumlah dan tipe transformasi digunakan sebagai fungsi distance.

2.5.3 Graph Description 2.5.4 Discrete Feature

Dari thinned character, fitur berikut ini dapat diekstraksi: 1. Jumlah loops (lubang)

2. Jumlah T-join

3. Jumlah tikungan/bengkokan

(11)

5. Adanya isolated dot

6. Jumlah endpoints dan jumlah endpoints pada setiap direction N, S, E, W 7. Jumlah semi lingkarang di setiap direction

8. Jumlah perpotongan dengan garis vertical dan horizontal

9. Jarak dari bounding box berdasarkan garis vertical dan horizontal

10. Hook

11. Open up/open down

12. Garis veritkal/horizontal

(12)

14. Garis

2.5.5 Zoning

Metode ini membagi image ke dalam beberapa zona. Pada masing-masing zona dihitung panjang dari character graph yang ada. Fitur ini dapat dibuat size dependent namun tidak dengan rotation. Ada atau tidaknya junction atau endpoints pada suatu zona dapat menjadi fitur tambahan.

2.5.6 Fourier Descriptor

Metode ini sama dengan representasi image lainnya.

3 Referensi

1. Feature extraction methods for character recognition-a survey (Ř Due Trier, AK Jain… - Pattern recognition, 1996 - Elsevier)

2. Optical Character Recognition for Handwritten Characters (Giorgos Vamvakas)

3. Optical Character Recognition dengan Metode Gabungan Template Matching dan Feature Extraction (Denny Setiawan, Tugas Akhir di Universitas Kristen Petra)

4. Representation and recognition of handwritten digits using deformable templates (Jain, Zongker. 1997)

Metode Feature Extraction untuk Character Recognition