Ao inserir uma consulta em uma página de mecanismo de pesquisaou na barra de pesquisa (na parte superior da tela) do navegador, os eventos que estão ocultos do usuário comum começam a ocorrer. Como, então, estão as informações necessárias na vasta World Wide Web, e qual é a relevância da pesquisa? A própria palavra vem do latim "relevo" e é traduzida para o russo como "levantar" ou "iluminar". O equivalente em inglês do termo é “relevância”. A cláusula 3.5.1 do GOST 7.73-96 decifra este conceito, sendo que "relevância" e "relevante" têm a mesma definição, que consiste na correspondência da informação recebida com a solicitação de informação feita pelo usuário.
Este padrão de estado contém outrostermos e definições padronizados úteis relacionados com o campo da recuperação da informação e sua disseminação usando sistemas de informação automatizados. O documento ajuda a entender o significado de muitas palavras em atividades de informação, publicação ou biblioteca, e não apenas uma unidade de linguagem como "relevância". A definição dos termos "pertinência" e "pertinente" também é decifrada pela cláusula 3.5.2 do GOST 7.73-96. Eles devem ser interpretados como a correspondência dos dados de informação recebidos com as necessidades de informação. Muitas vezes esse conceito é confundido com relevância, o que é fundamentalmente errado, já que em um caso estamos falando sobre atender a uma solicitação e, no outro, sobre atender uma necessidade. Também é errado responder à pergunta "o que é relevância?" respondo que esse termo se aproxima do conceito de "adequação", ou seja, da aplicabilidade prática do resultado.
Mas como a informação é encontrada?O mecanismo de busca usa um exército de bots - programas autônomos que visitam sites e armazenam informações sobre eles. Este nome vem da palavra inglesa "bot", ou seja, abreviado de "robot". Esses programas localizam novos sites e, em seguida, vão para a página inicial e exibem seu conteúdo. Os bots aprendem páginas associadas aos links internos da página inicial (que é carregada primeiro no navegador). Além disso, os bots procuram links que apontam para outros sites, ou seja, links externos. Mantendo essas informações, eles os percorrem, descobrem novos sites e aprendem como os recursos da web estão conectados uns aos outros. Assim, eles estudam incansavelmente o "mapa" da World Wide Web. Mas o que é relevância? Como isso se relaciona com os bots?
Com um exemplo específico, vamos ver o que eles oferecemmotores de busca Yandex e Google. À pergunta "o que é relevância?" Yandex tem 28 milhões de respostas, enquanto o Google tem 155 mil. Aqui podemos dizer que todas correspondem ao pedido, mas nem sempre às necessidades, ou seja, nem todas serão pertinentes. Por exemplo, páginas que explicam esse conceito no SEO da Wikipedia, sem dúvida, serão úteis, e um site sobre custos relevantes e irrelevantes na tomada de decisões não é relevante para este tópico. Um exemplo mais ilustrativo é quando Yandex deu 31 milhões de respostas a um pedido de “mãos ao alto”, que implicava em obter informações sobre um grupo musical, e entre elas há um artigo pedindo para levantar a mão, pois isso, segundo os fisioterapeutas, é muito útil. Essa resposta não pode ser considerada pertinente, embora seja 586 em 31 milhões de respostas.
Assim, quanto maior a relevância do texto, maisé mais provável que entre nas primeiras posições das respostas da pesquisa. Este indicador tem uma avaliação quantitativa, mas os algoritmos para a sua implementação para vários motores de pesquisa diferem e são desconhecidos dos utilizadores, e também mudam ao longo do tempo, uma vez que os motores de pesquisa, tentando subir nas classificações, procuram fornecer informações pertinentes, diminuindo o tempo de pesquisa. Páginas altamente relevantes são aquelas em que a ocorrência de uma palavra-chave que corresponda à solicitação pode variar de 3 a 7%. Mas esse não é o único critério para a relevância de um documento. Isso inclui uma série de indicadores internos e externos. Os indicadores internos (exceto para a densidade de palavras-chave) são sua posição no texto (entrada no título, sua proximidade com o título e entre si, com a formação de prováveis frases de pesquisa), bem como a presença de sinônimos, confirmando a conformidade do conteúdo do texto com a solicitação. O principal indicador externo é considerado a popularidade na rede global, que é indicada pelo PageRank do Google, TIC da Yandex e Top100 da Rambler. Ou seja, quantas vezes a página é visitada de outros sites, é melhor se eles tiverem classificações altas. Isso é relevância.