Information Retrieval: Query Suggestion
Apakah anda pernah mencari sesuatu di internet melalui google, atau mungkin bing, atau semacamnya? Pernah tidak ketika mencari kalian mendapatkan saran kata-kata pelengkap kalimat?
Fenomena sugesti kata-kata ini bisa disebut sebagai query suggestion. Query suggestion (QS) merupakan teknik dari ilmu Information retrieval dimana sistem akan memberikan saran query untuk menggantikan query awal pengguna, contoh pada gambar yaitu query awal adalah “kenapa”. Tujuan dari QS adalah untuk meningkatkan hasil dari pencarian.
Penggunaan QS didasarkan pada asumsi bahwa saat awal pengetikan query, pengguna sistem information retrieval seperti google search belum mengerti ingin mencari apa, atau maksud dari yang diinginkan berbeda dengan apa yang diketik.
Secara umum terdapat dua metode untuk mendapatkan daftar QS:
- Clickthrough-based QS, dimana sistem menyimpan historikal url web yang pernah di-klik oleh pengguna. Kemudian, dilakukan pengelompokan terhadap web page tersebut. Kalau ada 2 atau lebih query yang memiliki url yang sama, atau konten page yang mirip, maka query-query tersebut dianggap terkait.
- Session-based QS. Jika data yang dilihat pada clicktrough adalah data url, maka dalam session-based data yang dilihat adalah data-data query yang dimasukkan pengguna ke dalam sistem pencarian, dalam rentang waktu tertentu (atau tanpa rentang waktu tergantung keinginan pembangun sistem). Jadi, data yang dianalisa adalah: hostorikal query pencarian pengguna.
Selain diharapkan mampu meningkatkan hasil dari pencarian, QS juga lebih intuitif (jika diberikan User Interface yang intuitif pula) karena bersifat suggestion maka pengguna bisa tidak mengubah query awalnya. Berbeda dengan metode perbaikan query lain seperti query expansion dan query reformulation dimana mengubah query awal tanpa persetujuan pengguna.
Referensi:
- Ooei, J., Qin, H., Ma, X., Liew, S. Q., A Survey of Query Expansion, Query Suggestion and Query Refinement Techniques. DOI: 1109/ICSECS.2015.7333094
- Meng, L., A Survey on Query Suggestion. DOI: 14257/IJHIT.2014.7.6.04