Три важных критерия оценки качества работы любой поисковой системы
Сегодня хотелось бы рассмотреть критерии, по которым оценивают работу поисковиков. Первый критерий – это дословность, процент найденных в поисковой выдаче релевантных документов. Что это может означать? Набираем в поисковике слово «школа», формируется выдача, состоящая из 150 документов. Другими словами, некая поисковая система «У» нашла по набранному запросу «школа» сто пятьдесят документов. Если вы хотите узнать, в чём заключается процесс лидерство, стоит перейти на официальный сайт pro-vse.ru и прочесть интересную информацию.
Мы глазами анализируем эти документы и к удивлению обнаруживаем, что девяносто шесть из них действительно какое-то отношение к «школам» имеют, а четыре оставшиеся вообще никакого. Какие-нибудь сайты-дорвей, ведущие на совершенно посторонние ресурсы. Очевидно, предположить, что из этих ста пятидесяти документов девяносто шесть релевантны, а четыре не релевантны. Точность данной выдачи 96%. Вполне допустимая точность. А закупка вечных ссылок по советам с сайта seopmr. ru может улучшить положение.
Следующий критерий – полнота. Это доля найденных релевантных документов в общем числе релевантных документов коллекции. (Коллекция – это совокупность всех документов, знакомых поисковой системе). Поисковая система Яндекс знает, порядка, четыре с небольшим миллиарда документов. Из них – три миллиарда документов это русскоязычный интернет, и миллиард с небольшим – это документы англоязычного интернета. Усилить полноту документа можно перелинковкой, а как сделать перелинковку сайта описано тут
В этой всей коллекции есть какое-то количество документов имеющих отношение к запросу «школа». Система просмотрела три миллиарда документов и определила, что пятьсот документов имеют отношение к запросу «школа». А найдено было только сто пятьдесят. Таким образом, полнота нашей выдачи 20%. То есть, находится только одна пятая часть из релевантных документов, что в принципе не очень хорошо. Математическая модель работает слишком жестко. Ей нужно меньше документов отсеивать.
Третий критерий – актуальность. Если выдача полная, точная, все красиво, нажимаем на первое место выдачи, там написано – «извините, сайт переехал». На второе место нажимаем в выдаче, написано – «такой документ не существует». На третье место в выдаче нажимаем, а там уже не про «школу», а скажем про продажу автомобилей. То есть, выдача совершенно не актуальна.