関連性とは

検索エンジンページでクエリを入力するときまたは、ブラウザの検索バー(画面上部)で、一般ユーザーには表示されないイベントが発生し始めます。では、広大なWorld Wide Webで必要な情報はどのようなものであり、検索の関連性とは何でしょうか。単語自体はラテン語の「レレボ」に由来し、ロシア語に「リフト」または「軽量化」として翻訳されます。英語での用語は「関連性」です。 GOST 7.73-96の節3.5.1はこの概念を解読し、「関連性」と「関連性」は同じ定義を持っています。これは、受信した情報とユーザーが行った情報要求との対応にあります。

この州の基準には他の自動化された情報システムを使用した情報検索およびその普及の分野に関連する有用な標準化された用語と定義。このドキュメントは、「関連性」などの言語単位だけでなく、情報提供、出版、または図書館活動における多くの単語の意味を理解するのに役立ちます。 「関連性」および「関連性」という用語の定義は、GOST 7.73-96の節3.5.2でも解読されています。それらは、受信した情報データと情報ニーズの対応として解釈されるべきです。多くの場合、この概念は関連性と混同されますが、これは根本的に間違っています。1つのケースでは要求を満たすことについて話し、もう1つはニーズを満たすことについて話しているためです。 「関連性とは何か」という質問に答えることも間違っています。この用語は「妥当性」の概念、つまり結果の実際的な適用性に近いと答えてください。

しかし、情報はどのようにして見つけられるのでしょうか? 検索エンジンはボットの軍隊を使用します-ボットはWebサイトを訪問してそれらに関する情報を保存するスタンドアロンプ​​ログラムです。この名前は、英語の「bot」に由来します。つまり、「robot」の略です。これらのプログラムは新しいサイトを見つけて、ホームページに移動し、そのコンテンツを表示します。ボットは、ホーム(ブラウザーに最初にロードされる)内部リンクに関連付けられたページを学習します。また、ボットは他のサイトを指すリンク、つまり外部リンクを調べます。この情報を保持しながら、彼らはそれらを調べ、新しいサイトを発見し、Webリソースが相互にどのように接続されているかを学びます。したがって、彼らは不断にWorld Wide Webの「地図」を研究します。しかし、関連性とは何ですか?それはボットとどのように関係していますか?

特定の例で、彼らが提供するものを見てみましょう検索エンジンYandexとGoogle。 「関連性とは何か」という質問に。 Yandexの応答数は2,800万、Googleの応答数は15万5千です。ここでは、それらはすべて要求に対応していると言えますが、必ずしもニーズとは限りません。つまり、すべてが適切であるとは限りません。たとえば、WikipediaのSEOでこの概念を説明するページは間違いなく有用であり、意思決定に関連するコストと無関係のコストに関するサイトはこのトピックには関連しません。より実例となる例は、Yandexが「ハンズアップ」リクエストに3100万の応答を与えたときであり、これは音楽グループに関する情報を取得することを意味し、その中には理学療法士によると、これは非常に有用であるため、手を上げるように求める記事があります。このような回答は、3100万の回答のうち586にランク付けされますが、適切とは言えません。

したがって、テキストの関連性が高いほど、より多くの検索回答の最初の位置に入る可能性が高くなります。この指標には定量的な評価がありますが、さまざまな検索エンジンに実装するためのアルゴリズムは異なり、ユーザーにはわかりません。また、検索エンジンはランキングを上げようとし、適切な情報を提供しようとし、検索にかかる時間を短縮するため、時間とともに変化します。関連性の高いページとは、リクエストに一致するキーワードの出現率が3〜7%のページです。しかし、これはドキュメントの関連性の唯一の基準ではありません。これらには、多くの内部および外部インジケーターが含まれます。内部的な指標(キーワードの密度を除く)は、テキスト内の位置(タイトルへのエントリ、タイトルへの近接度、および検索語句が形成される可能性がある)と、類義語の存在であり、テキストのコンテンツが要求に一致することを確認します。主な外部指標はグローバルネットワークで人気があると考えられています。これは、GoogleのPageRank、YandexのTIC、RamblerのTop100で示されています。つまり、そのページが他のサイトからどのくらいの頻度でアクセスされるかは、それらが高い評価を持っている場合に適しています。それが関連性です。