Când introduceți o interogare pe pagina motorului de căutaresau în bara de căutare (în partea de sus a ecranului) browserul începe să se întâmple evenimente ascunse de utilizatorii obișnuiți. Cum, deci, în vasta World Wide Web sunt informațiile necesare și care este relevanța căutării? Cuvântul însuși vine din latina "relevo" și este tradus în limba rusă, ca "ascensiune" sau "facilita". Echivalentul în engleză al termenului - "relevanță". La punctul 3.5.1 din GOST 7.73-96, acest concept este descifrat, iar "relevanța" și "relevanța" au aceeași definiție, care constă în corespondența informațiilor primite cu cererea de informații făcută de utilizator.
Acest standard de stat conține alteletermeni și definiții standardizate utile legate de domeniul recuperării informațiilor și diseminării acesteia utilizând sisteme informatice automate. Documentul ajută la înțelegerea semnificației multor cuvinte în activități informaționale, de publicare sau de bibliotecă, și nu doar o astfel de unitate de limbaj ca „relevanță”. Definiția termenilor „pertinență” și „pertinent” este descifrată și de clauza 3.5.2 din GOST 7.73-96. Acestea ar trebui interpretate ca corespondența datelor primite cu nevoile de informații. Adesea, acest concept este confundat cu relevanța, care este fundamental greșită, deoarece într-un caz vorbim despre respectarea unei cereri, iar în celălalt - despre respectarea unei nevoi. De asemenea, este greșit să răspunzi la întrebarea „ce este relevanță?” răspundeți că acest termen se apropie de conceptul de „adecvare”, adică de aplicabilitatea practică a rezultatului.
Dar cum se găsesc informațiile?Motorul de căutare folosește o armată de roboți - programe autonome care vizitează site-uri web și stochează informații despre acestea. Acest nume provine din cuvântul englezesc „bot”, adică prescurtat din „robot”. Aceste programe găsesc site-uri noi și apoi merg la pagina de pornire și vizualizează conținutul acesteia. Roboții învață pagini asociate cu linkurile interne de acasă (care este încărcată mai întâi în browser). De asemenea, roboții analizează link-uri care indică alte site-uri, adică link-uri externe. Salvând aceste informații, le parcurg, descoperă site-uri noi și află cum sunt conectate resursele web. Astfel, ei studiază neobosit „harta” World Wide Web. Dar care este relevanța? Ce legătură are cu roboții?
Cu un exemplu specific, să vedem ce oferămotoarele de căutare Yandex și Google. La întrebarea „ce este relevanță?” Yandex are 28 de milioane de răspunsuri, în timp ce Google are 155 de mii. Aici putem spune că toate corespund cererii, dar nu întotdeauna nevoile, adică nu toate vor fi pertinente. De exemplu, paginile în care SEO-ul Wikipedia explică acest concept vor fi fără îndoială utile, iar un site despre costuri relevante și irelevante în luarea deciziilor nu este relevant pentru acest subiect. Un exemplu mai ilustrativ este atunci când Yandex a dat 31 de milioane de răspunsuri la o cerere „hands up”, care presupunea obținerea de informații despre un grup muzical, iar printre acestea există un articol care solicită să ridici mâinile în sus, deoarece, potrivit fizioterapeuților, este foarte util. Un astfel de răspuns nu poate fi considerat pertinent, deși ocupă locul 586 în rezultatele căutării din 31 de milioane de răspunsuri.
Astfel, cu cât este mai mare relevanța textului, cu atât mai multeste mai probabil ca acesta să intre în primele poziții ale răspunsurilor de căutare. Acest indicator are o evaluare cantitativă, dar algoritmii pentru implementarea sa pentru diverse motoare de căutare diferă și sunt necunoscuți de utilizatori și se schimbă și în timp, deoarece motoarele de căutare, încercând să crească în clasament, încearcă să furnizeze informații pertinente, reducând este timpul să îl căutăm. Paginile foarte relevante sunt cele în care apariția unui cuvânt cheie care corespunde cererii poate varia de la 3 la 7%. Dar acesta nu este singurul criteriu pentru relevanța unui document. Acestea includ o serie de indicatori interni și externi. Indicatorii interni (cu excepția densității cuvintelor cheie) sunt poziția lor în text (intrarea în titlu, apropierea lor de titlu și unul de celălalt, cu formarea de fraze de căutare probabile), precum și prezența sinonimelor, confirmând că conținutul textului corespunde cererii. Principalul indicator extern este considerat a fi popularitatea în rețeaua globală, care este indicat de PageRank de la Google, TIC de la Yandex și Top100 de la Rambler. Adică, cât de des este vizitată pagina de pe alte site-uri, este mai bine dacă au evaluări ridicate. Aceasta este relevanța.