/ / Cos'è la rilevanza

Cos'è la rilevanza

Quando si immette una query sulla pagina di un motore di ricercao nella barra di ricerca (nella parte superiore dello schermo) del browser, iniziano a verificarsi eventi nascosti agli utenti ordinari. Come sono, quindi, le informazioni necessarie sul vasto World Wide Web e qual è la pertinenza della ricerca? La parola stessa deriva dal latino "rilevo" ed è tradotta in russo come "sollevare" o "schiarire". L'equivalente inglese del termine è "rilevanza". La clausola 3.5.1 di GOST 7.73-96 decifra questo concetto, e "rilevanza" e "pertinente" hanno la stessa definizione, che consiste nella corrispondenza delle informazioni ricevute alla richiesta di informazioni effettuata dall'utente.

Questo standard statale contiene altritermini e definizioni standardizzati utili relativi al campo del reperimento delle informazioni e della loro diffusione mediante sistemi informatici automatizzati. Il documento aiuta a comprendere il significato di molte parole nell'informazione, nell'editoria o nelle attività di biblioteca, e non solo un'unità di linguaggio come "rilevanza". La definizione dei termini "pertinenza" e "pertinente" è decifrata anche dalla clausola 3.5.2 di GOST 7.73-96. Dovrebbero essere interpretati come la corrispondenza dei dati informativi ricevuti alle esigenze di informazione. Spesso questo concetto viene confuso con la pertinenza, il che è fondamentalmente sbagliato, poiché in un caso si tratta di soddisfare una richiesta e nell'altro di soddisfare un bisogno. È anche sbagliato rispondere alla domanda "cos'è la rilevanza?" rispondo che questo termine è vicino al concetto di "adeguatezza", cioè di applicabilità pratica del risultato.

Ma come si trovano le informazioni?Il motore di ricerca utilizza un esercito di bot: programmi autonomi che visitano i siti Web e memorizzano le informazioni su di essi. Questo nome deriva dalla parola inglese "bot", cioè abbreviata da "robot". Questi programmi trovano nuovi siti e poi vanno alla home page e ne visualizzano il contenuto. I bot apprendono le pagine associate ai link interni della home (che viene caricata per prima nel browser). Inoltre, i bot esaminano i collegamenti che puntano ad altri siti, ovvero collegamenti esterni. Memorizzando queste informazioni, le esaminano, scoprono nuovi siti e apprendono come le risorse web sono collegate tra loro. Così, studiano instancabilmente la "mappa" del World Wide Web. Ma cos'è la rilevanza? Come si relaziona ai bot?

Con un esempio specifico, vediamo cosa offronomotori di ricerca Yandex e Google. Alla domanda "cos'è la rilevanza?" Yandex ha 28 milioni di risposte, mentre Google ne ha 155mila. Qui possiamo dire che corrispondono tutti alla richiesta, ma non sempre alle esigenze, cioè non tutte saranno pertinenti. Ad esempio, le pagine in cui il SEO di Wikipedia spiega questo concetto saranno senza dubbio utili e un sito sui costi rilevanti e irrilevanti nel prendere decisioni non è rilevante per questo argomento. Un esempio più illustrativo è quando Yandex ha fornito 31 milioni di risposte a una richiesta "mani alzate", che implicava l'ottenimento di informazioni su un gruppo musicale, e tra loro c'è un articolo che invita ad alzare le mani, poiché questo, secondo i fisioterapisti, è molto utile. Una tale risposta non può essere considerata pertinente, sebbene si collochi 586 su 31 milioni di risposte.

Pertanto, maggiore è la rilevanza del testo, maggiore èè più probabile che entrerà nelle prime posizioni delle risposte di ricerca. Questo indicatore ha una valutazione quantitativa, ma gli algoritmi per la sua implementazione per i diversi motori di ricerca differiscono e sono sconosciuti agli utenti, e cambiano anche nel tempo, poiché i motori di ricerca, cercando di salire nelle classifiche, cercano di fornire informazioni pertinenti, riducendo il tempo di cercarlo. Le pagine altamente rilevanti sono quelle in cui l'occorrenza di una parola chiave che corrisponde alla richiesta può variare dal 3 al 7%. Ma questo non è l'unico criterio per la rilevanza di un documento. Questi includono una serie di indicatori interni ed esterni. Indicatori interni (fatta eccezione per la densità delle parole chiave) sono la loro posizione nel testo (entrata nell'intestazione, la loro vicinanza all'intestazione e tra loro, con formazione di probabili frasi di ricerca), nonché la presenza di sinonimi, a conferma della corrispondenza del contenuto del testo alla richiesta. Il principale indicatore esterno è considerato la popolarità nella rete globale, indicata da PageRank di Google, TIC di Yandex e Top100 di Rambler. Cioè, quanto spesso la pagina viene visitata da altri siti, è meglio se hanno valutazioni alte. Ecco cos'è la rilevanza.