관련성이란?

검색 엔진 페이지에 검색어를 입력 할 때또는 브라우저의 검색 창 (화면 상단)에서 일반 사용자에게 숨겨진 이벤트가 발생하기 시작합니다. 그렇다면 방대한 World Wide Web에서 필요한 정보는 어떻게되며 검색 관련성은 무엇입니까? 단어 자체는 라틴어 "relevo"에서 유래되었으며 "lift"또는 "lighten"으로 러시아어로 번역됩니다. 이 용어에 해당하는 영어는 "관련성"입니다. GOST 7.73-96의 3.5.1 절은이 개념을 해독하고 "관련성"과 "관련성"은 동일한 정의를 가지며, 이는 사용자가 요청한 정보에 대해 수신 된 정보의 대응으로 구성됩니다.

이 주 표준에는 다른자동화 된 정보 시스템을 사용하여 정보 검색 및 보급 분야와 관련된 유용한 표준화 된 용어 및 정의. 이 문서는 "관련성"과 같은 언어 단위뿐만 아니라 정보, 출판 또는 도서관 활동에서 많은 단어의 의미를 이해하는 데 도움이됩니다. 용어 "관련성"및 "관련성"의 정의는 GOST 7.73-96의 3.5.2 절에 의해 해독됩니다. 이들은 수신 된 정보 데이터가 정보 요구에 부합하는 것으로 해석되어야합니다. 종종이 개념은 관련성과 혼동되는데, 이는 근본적으로 잘못된 데, 한 경우에는 요청 일치에 대해 이야기하고 다른 경우에는 요구 충족에 대해 이야기하기 때문입니다. "관련성이란 무엇입니까?"라는 질문에 대답하는 것도 잘못되었습니다. 이 용어는 "적절성"의 개념, 즉 결과의 실제 적용 가능성에 가깝다고 대답합니다.

그러나 정보는 어떻게 발견됩니까? 검색 엔진은 웹 사이트를 방문하고 이에 대한 정보를 저장하는 독립 실행 형 프로그램 인 봇군을 사용합니다. 이 이름은 영어 단어 "bot", 즉 "robot"에서 축약 된 것입니다. 이러한 프로그램은 새 사이트를 찾은 다음 홈 페이지로 이동하여 해당 콘텐츠를 봅니다. 봇은 홈 (브라우저에 먼저로드 됨) 내부 링크와 관련된 페이지를 학습합니다. 또한 봇은 다른 사이트, 즉 외부 링크를 가리키는 링크를 확인합니다. 이 정보를 저장함으로써 그들은 그것들을 살펴보고, 새로운 사이트를 발견하고, 웹 리소스가 서로 어떻게 연결되어 있는지를 배웁니다. 따라서 그들은 월드 와이드 웹의 "지도"를 끊임없이 연구합니다. 그러나 관련성은 무엇입니까? 봇과 어떤 관련이 있습니까?

구체적인 예를 들어 그들이 제공하는 것을 보자검색 엔진 Yandex 및 Google. "관련성이란 무엇입니까?"라는 질문에 Yandex는 2,800 만 개의 응답을 가지고 있고 Google은 155,000 개의 응답을 가지고 있습니다. 여기에서 우리는 그들이 모두 요청을 충족하지만 항상 필요한 것은 아닙니다. 즉, 그들 모두가 적절하지는 않다고 말할 수 있습니다. 예를 들어 Wikipedia의 SEO가이 개념을 설명하는 페이지는 의심 할 여지없이 유용 할 것이며, 결정을 내리는 데 관련되고 관련없는 비용에 대한 사이트는이 주제와 관련이 없습니다. 더 예시적인 예는 Yandex가 "hands up"요청에 대해 3100 만 응답을했을 때입니다. 이는 음악 그룹에 대한 정보를 얻는 것을 의미하며, 그중에는 물리 치료사에 따르면 매우 유용하기 때문에 손을 들어야한다는 기사가 있습니다. 이러한 답변은 3100 만 응답 중 586 위를 차지하지만 적절한 것으로 간주 할 수 없습니다.

따라서 텍스트의 관련성이 높을수록검색 답변의 첫 번째 위치에 들어갈 가능성이 더 높습니다. 이 지표에는 정량적 평가가 있지만 다른 검색 엔진에 대한 구현 알고리즘이 다르며 사용자에게 알려지지 않았으며 검색 엔진이 순위를 올리려고 노력하고 관련 정보를 제공하려고 시도하기 때문에 검색 시간이 단축되기 때문에 시간이 지남에 따라 변경됩니다. 관련성이 높은 페이지는 요청과 일치하는 키워드의 발생률이 3 ~ 7 % 인 페이지입니다. 그러나 이것이 문서의 관련성에 대한 유일한 기준은 아닙니다. 여기에는 여러 내부 및 외부 지표가 포함됩니다. 내부 지표 (키워드 밀도 제외)는 텍스트에서의 위치 (제목 입력, 가능한 검색 구문의 형성과 함께 표제 및 서로에 대한 근접성) 및 동의어의 존재 여부로, 텍스트 내용이 요청과 일치하는지 확인합니다. 주요 외부 지표는 Google의 PageRank, Yandex의 TIC 및 Rambler의 Top100으로 표시되는 글로벌 네트워크에서 인기있는 것으로 간주됩니다. 즉, 다른 사이트에서 페이지를 얼마나 자주 방문하는지, 평점이 높으면 더 좋습니다. 그것이 바로 관련성입니다.