Pengenalan Wajah: Teknik Mendeteksi Lokasi Wajah dalam Gambar dan Video
Pendeteksian wajah merupakan bagian terpenting dalam pengenalan atau analisis wajah, dan melupakan langkah pertama yang terdapat dalam sistem otomatis pengenalan atau analisis wajah. Pada gambar atau video yang dimasukkan, algoritma pendeteksi wajah perlu mendeteksi dan melokalisasi dimana lokasi wajah tersebut, dan memasangkan kotak koordinatnya mengeliling wajah dengan ukuran yang pas. Tantangan yang terbesar yang dialami algoritma pendeteksian wajah tradisional seperti haar waveled dan Histogram of Oriented Gradient (HOG) tidak ditangkapnya informasi fitur yang menonjol pada gambar atau video yang memiliki perbedaan resolusi, sudut pandang, pencahayaan, ekspresi, warna kulit, halangan dan kondisi kosmetil. Batasan ini menyebabkan kesulitan dalam melakukan klasifikasi. Teknik tingkat lanjut yang bernama deep learning memberikan pencerahan baru dalam pendeteksian lokasi dari wajah, teknik ini memungkinkan mengekstrasi feature dari DCNN, feature DCNN yang hasilkan oleh proses training yang menggunakan data besar dapat digunakan sebagai feature extractor. Feature yang dihasilkan oleh teknik DCNN ini dapat digunakan untuk mendeteksi lokasi wajah. Feature yang dihasilkan dari teknik DCNN ini sebenarnya masih bisa dimanfaatkan untuk mengekstrak informasi yang lain selain pendeteksian wajah.
Metode pendeteksian wajah pada DCNN ini dibagi menjadi dua pendekatan, pendekatan yang pertama adalah pendekatan region based dan pendekatan yang kedua adalah pendekatan sliding windows.
- Pendekatan region based
Pendekatan region based ini menghasilkan sekumpulan obyek generic (mendekati 2000 obyek pergambar) dan sebuah DCNN ditugaskan untuk memberikan usulan gambar apakah mengandung wajah atau tidak. Arsitektur yang pernah dibuat menggunakan teknik ini adalah algoritma selective search (20). HyperFace(10) dan All-in-one-One-Face (Ranjan et al, 2017, p17-24). Kesulitan dari pendekatan ini adalah sulit mendeteksi lokasi wajah dan membutuhkan komputasi yang cukup lama, hal ini disebabkan oleh banyaknya kandidat lokasi yang harus di cek.
- Pendekatan Sliding Windows
Metode sliding windows, adalah pendekatan yang melalukan perhitungan score pendeteksian wajah dan memberikan kotak pada sekeliling wajah dalam berbagai skala. Teknik ini lebih cepat dibandingkan dengan metode yang berdasarkan region dan dapat diimplementasikan menggunakan operasi convolutional yang dapat bekerja pada sliding windows. Ada beberapa sistem yang menggunakan teknik sliding windows seperti DP2MFD (Ranjan et all, 2015, p1-8) dan DDFD (Farfade et all). Beberapa sistem mengabungkannya dengan konfigurasi wajah untuk menghasilkan score final.
- Pendekatan Single Shoot Detector (SSD)
Sebenarnya pendekatan ini adalah untuk mendeteksi keberadan obyek, tapi juga dapat dimanfaatkan untuk mendeteksi wajah. Dasar dari pendekatan SSD ini sebenarnya adalah Sliding Windows. Perbedaannya adalah dari pada membuat image yang terdiri dari berbagai ukuran, pendekatan ini memanfaatkan fitur yang terdapat pada DCNN, yang memiliki struktur pyramid yang terdapat didalam berbagai layer dari DCNN. Karena teknik ini hanya menggunakan sebuah proses kedepan yang tunggal, maka pendekatan ini merupakan pendekaran yang cepat untuk mendeteksi keberadaan wajah dalam sebuah gambar.
Sebenarnya masih ada beberapa lagi pendekatan yang dimanfaatka dalam mendeteksi keberadaan wajah, namun saat ini penulis, menyudahi pembahasan tentang pendeteksian wajah pada sistem pengenalan wajah. Proses pendeteksian lokasi wajah ini memegang peranan penting dalam pengenalan wajah karena dengan dengan menentukan lokasi wajah dan menfokuskan proses pada bagian wajah tersebut maka proses pengenalan wajah akan menjadi lebih cepat dalam performanya karena mereduksi proses komputasi sistem dan akurat untuk mendeteksi wajah.
Daftar Pustaka
- S. Farfade, M. J. Saberian, and L.-J. Li, “Multi-view face detection using deep convolutional neural networks,” in Proc. ACM Int. Conf. Multimedia Retrievals,
- Ranjan, V. M. Patel, and R. Chellappa, “A deep pyramid deformable part model for face detection,” in Proc. IEEE 7th Int. Conf. Biometrics Theory, Applications and Systems, 2015, pp. 1–8.
- Ranjan, S. Sankaranarayanan, C.D. Castilo, and R. Chellapa, “All in One Convolutional Neural Network for face analysis”, in Procc IEEE Int Conf. Automatic Face Gesture Recognition, 2017, p 17-24
- Ranjan, S. Sankaranarayan, Basal. A Basal, Bodla N. Chen J.C, Patel V.M., Castillo, C.D., Chellopa R., “Deep Learning for understanding Faces-Machines may be just a food, or better, than human.”, IEEE Signal Processing Magazine, 2018, p66-83.