Релевантність

Матеріал з Словник з інформатики
Перейти до: навігація, пошук

Релева́нтність (англ. relevance) — міра відповідності отримуваного результату бажаному.

В термінах пошуку — це міра відповідності результатів пошуку завданню, поставленому в пошуковому запиті.

Нерелевантний документ — документ, що був відібраний у результаті інформаційного пошуку, але зміст якого не відповідає запиту користувача.

Визначає, наскільки повно той або інший документ відповідає критеріям, вказаним у запиті користувача. Необхідно враховувати, що в кожній пошуковій системі працює власна програма (спайдер), що індексує веб-сторінки. Кожна система індексує сторінки своїм особливим способом і пріоритети при пошуку за індексами теж різні. Тому запит за одними і тими ж ключовими словами в кожній з пошукових систем породжує різні результати.

Релевантність пошуку

Це є суб'єктивним поняттям, оскільки результати пошуку, які підходять для одного користувача, можуть не підходити для іншого.

Основним методом для оцінки релевантності є TF-IDF-метод, який використовується у більшості пошукових систем (як в інтернет-пошуковиках, так і у довідкових системах (MSDN). Його зміст зводиться до того, що чим більша локальна частота терміну (запиту) у документі (TF) і більша «рідкість» (тобто, чим рідше він зустрічається в інших документах) терміну у колекції (IDF), тим вище вага даного документу відносно терміну — тобто документ буде видаватись раніше у результатах пошуку за даним терміном. Автором методу є Gerard Salton (у подальшому дороблений Карен Спарк Джонс‎).