Hvad er relevans

Når du indtaster en forespørgsel på en søgemaskinsideeller i søgefeltet (øverst på skærmen) i browseren begynder der begivenheder, der er skjult for almindelige brugere. Hvordan er de nødvendige oplysninger på den store verdensweb, og hvad er søgerelevans? Selve ordet kommer fra det latinske "relevo" og oversættes til russisk som "lift" eller "lighten". Det engelske ækvivalent til udtrykket er relevans. I afsnit 3.5.1 i GOST 7.73-96 er dette koncept afkrypteret, og "relevans" og "relevant" har den samme definition, som består i korrespondance mellem den information, der er modtaget til den informationsanmodning, der er fremsat af brugeren.

Denne tilstandsstandard indeholder andreNyttige standardiserede vilkår og definitioner, der er relateret til informationsindsamling og udbredelse heraf ved hjælp af automatiserede informationssystemer. Dokumentet hjælper med at forstå betydningen af ​​mange ord i informations-, udgivelses- eller biblioteksaktiviteter og ikke kun en sådan enhed af sprog som ”relevans”. Definitionen af ​​udtrykkene "kontinent" og "kontinent" afkrypteres også i punkt 3.5.2 i GOST 7.73-96. De skal fortolkes som korrespondance mellem de modtagne informationsdata og informationsbehovene. Ofte forveksles dette koncept med relevans, hvilket grundlæggende ikke er sandt, da vi i det ene tilfælde taler om at matche anmodningen og i det andet om at matche behovene. Det er også forkert at besvare spørgsmålet: "hvad er relevant?" at svare på, at dette udtryk er tæt på begrebet "tilstrækkelighed", det vil sige den praktiske anvendelighed af resultatet.

Men hvordan findes oplysningerne stadig?Søgemaskinen bruger en hær af bots - selvstændige programmer, der besøger websteder og gemmer information om dem. Dette navn kommer fra det engelske ord "bot", det vil sige forkortet fra "robot". Disse programmer finder nye steder og går derefter til hovedsiden og gennemser dens indhold. Bots lærer sider relateret til hjemmet (i browseren indlæses det først) interne links. Botprogrammer ser også på links, der peger på andre sider, det vil sige eksterne links. Opbevaring af disse oplysninger følger de efter, opdager nye sider og finder ud af, hvordan webressourcer er relateret. Således studerer de utrætteligt "kortet" af World Wide Web. Men hvad er relevant? Hvad har det med bots at gøre?

For et specifikt eksempel, lad os se, hvad de tilbydersøgemaskiner Yandex og Google. Til spørgsmålet "hvad er relevans?" 28 millioner svar blev fundet i Yandex, og Google havde 155 tusind. Her kan vi sige, at de alle svarer til anmodningen, men ikke alle er krav, dvs. ikke alle vil være kontinentale. F.eks. Vil sider, hvor der gives en forklaring af dette koncept i Wikipedia CEO, uden tvivl være nyttige, og et websted om relevante og irrelevante omkostninger ved beslutningstagning er ikke relevant for dette emne. Et mere indlysende eksempel er, når Yandex udsendte 31 millioner svar på en anmodning om “hænderne”, hvilket indebar, at man modtog information om en musikalsk gruppe, og blandt dem var der en artikel, der opfordrede til at løfte hænderne op, da dette ifølge fysioterapeuter er meget nyttigt. Et sådant svar kan ikke betragtes som et kontinent, selv om det ud af de 31 millioner svar besætter 586 positioner i emnet.

Jo større tekstens relevans er, desto højere er tekstenmere sandsynligt, at han kommer ind i de første positioner med søgesvar. Denne indikator har en kvantitativ vurdering, men algoritmerne til dens implementering i forskellige søgemaskiner er forskellige og ukendte for brugerne, og de ændrer sig med tiden, da søgemaskiner forsøger at stige i placeringer, forsøger at give relevant information, hvilket reducerer den tid det tager at finde den. Meget relevante sider er dem, hvor forekomsten af ​​et nøgleord, der matcher forespørgslen, kan variere fra 3 til 7%. Men dette er ikke det eneste kriterium for dokumentets relevans. Disse inkluderer en række interne og eksterne indikatorer. Interne indikatorer (bortset fra nøgleordets tæthed) er deres placering i teksten (forekomst i overskriften, deres nærhed til overskriften og hinanden, med dannelse af sandsynlige søgesætninger), samt tilstedeværelsen af ​​synonymer, der bekræfter korrespondance mellem tekstindhold og anmodningen. Den vigtigste eksterne indikator anses for at være popularitet i det globale netværk, som er indikeret af PageRank for Google, TIC for Yandex og Tor100 for Rambler-systemet. Det vil sige, hvor ofte folk kommer til siden fra andre sider, det er bedre, hvis de har en høj rating. Det er, hvad relevansen er.