Приликом уноса упита на страници претраживачаили у траци за претрагу (на врху екрана) прегледача почињу да се дешавају догађаји који су скривени од обичних корисника. Како су потребне информације на огромној светској мрежи и шта је релевантност претраге? Сама реч потиче из латинског „релево“ и на руски се преводи као „лифт“ или „осветљење“. Енглески еквивалент израза је „релевантност“. Тачка 3.5.1 ГОСТ 7.73-96 дешифрује овај концепт, а „релевантност“ и „релевантност“ имају исту дефиницију, која се састоји у кореспонденцији примљених информација са захтевом за информацијама који је поднео корисник.
Овај државни стандард садржи и другекорисни стандардизовани термини и дефиниције који се односе на област претраживања информација и њихово ширење помоћу аутоматизованих информационих система. Документ помаже разумевању значења многих речи у информативним, издавачким или библиотечким делатностима, а не само такве јединице језика као „релевантност“. Дефиниција израза „релевантност“ и „релевантност“ такође је дешифрована у тачки 3.5.2 ГОСТ 7.73-96. Треба их тумачити као кореспонденцију примљених података о информацијама са потребама за информацијама. Често се овај концепт меша са релевантношћу, што је у основи погрешно, јер у једном случају говоримо о усаглашености са захтевом, ау другом - о усаглашености са потребом. Такође је погрешно одговарати на питање „шта је релевантност?“ одговор да је овај појам близак концепту „адекватности“, односно практичној применљивости резултата.
Али како се проналазе информације?Претраживач користи армију ботова - самосталних програма који посећују веб локације и чувају информације о њима. Ово име потиче од енглеске речи „бот“, односно скраћено од „робот“. Ови програми проналазе нове веб локације, а затим прелазе на почетну страницу и прегледавају њен садржај. Ботови уче странице повезане на домаће (које се прво учитавају у прегледачу) интерне везе. Такође, ботови гледају везе које воде до других веб локација, односно спољне везе. Чувајући ове информације, они их прегледавају, откривају нове веб локације и сазнају како су веб ресурси међусобно повезани. Тако неуморно проучавају „мапу“ светске мреже. Али шта је релевантност? Какве то везе има са ботовима?
На конкретном примеру, да видимо шта они нудепретраживачи Иандек и Гоогле. На питање "шта је релевантност?" Иандек има 28 милиона одговора, док Гоогле има 155 хиљада. Овде можемо рећи да сви они испуњавају захтев, али не увек потребе, односно неће сви бити релевантни. На пример, странице које објашњавају овај концепт у Википедијином СЕО-у несумњиво ће бити корисне, а веб локација о релевантним и небитним трошковима доношења одлука није релевантна за ову тему. Илустративнији пример је када је Иандек дао 31 милион одговора на захтев „руке увис“, што је подразумевало добијање информација о музичкој групи, а међу њима постоји и чланак у којем се тражи да се руке дигну, јер је ово, према мишљењу физиотерапеута, Веома корисно. Такав одговор се не може сматрати релевантним, иако сврстава 586 од 31 милиона одговора.
Дакле, што је релевантност текста већа, то је вишевероватније је да ће ући на прва места одговора за претрагу. Овај индикатор има квантитативну процену, али алгоритми за његову примену за различите претраживаче се разликују и непознати су корисницима, а временом се и мењају, јер претраживачи, покушавајући да се уздигну на ранг листи, покушавају да пруже одговарајуће информације, смањујући време је за тражењем. Веома релевантне странице су оне на којима се појава кључне речи која се подудара са захтевом може кретати од 3 до 7%. Али ово није једини критеријум за релевантност документа. Они укључују бројне интерне и екстерне показатеље. Унутрашњи показатељи (осим густине кључних речи) су њихов положај у тексту (улазак у наслов, близина наслова и међусобно, уз формирање вероватних фраза за претрагу), као и присуство синонима који потврђују да се садржај текста подудара са захтевом. Главним спољним показатељем сматра се популарност у глобалној мрежи, на шта указују ПагеРанк од Гоогле-а, ТИЦ од Иандек-а и Топ100 од Рамблер-а. Односно, колико често страницу посећују са других сајтова, боље је ако имају високу оцену. То је оно што је релевантно.