で情報を検索する機能のおかげでインターネット上では、誰でもすべてのニュースに遅れずについていくことができ、仕事や勉強に必要な情報を受け取り、知識を広げることができます。しかし、Webにアップロードされるデータの量は絶えず増加しており、この豊富な中で必要な資料を見つけることが非常に難しい場合があります。
そのような状況にならないために、人インターネット上の情報を検索する機能が必要です。これを行うには、検索エンジンがどのように機能するかを知り、クエリを明確に構成し、検索を大幅に簡素化するいくつかの手法を習得できる必要があります。
検索エンジンの概念
GoogleとYandexは、私たち全員に馴染みがあるか、すでに多くの人に忘れられているYahooとRamblerは、インターネットで情報を見つけるための主要なツールです。それらは、特殊なプログラムと強力なコンピューターで構成される複雑なシステムです。その動作原理は単純です。ユーザーが検索クエリを作成し、システムが情報ソースへのリンクのリストで応答します。リンクは、関連性の高い順にランク付けされます。つまり、リクエストに一致します。
インターネットはもともとコモンズでした組織であり、そこに含まれる情報の量は少ないです。しかし、徐々に状況は変わりました。 1994年にYahoo.comというサイトが登場し、その作成者の計画によれば、サイトのオープンディレクトリで必要な情報を検索する必要がありました。しかし、ワールドワイドウェブへの新しい情報の補充の速度は非常に速かったため、カタログでの検索はすぐにその有用性を失いました。同じ1994年に、インターネットリソースに関する情報を検索するための最初の本格的な検索エンジンWebCrawlerが作成され、3年後にGoogleが立ち上げられ、Yandexが発表されました。
検索エンジンの特徴
情報量の増加には、検索エンジンの品質の基本的な指標を改善する必要があります。これらには以下が含まれます:
- 完全性、つまり、受信したリンクのリストと検索クエリとの対応。
- 見つかったソースの要求への正確性または対応。
- 情報の関連性。
- 安定性で表される検索速度ロードするサーバー。この比率は直接依存で表されます。ユーザーが作成するクエリが多いほど、検索エンジンはそれらに応答する速度が速くなります。
- 可視性。これは、システムによって発行された結果のフレームワーク内で、ユーザーが必要とするサイトをより便利に選択できるようにすることで構成されます。
リストされた特性を可能な限り最大のレベルにするために、検索エンジンは2つの主な方法を使用してリソースを検索します。
1つ目は階層構造に関連しています情報カタログ。一番上の行は一般的なカテゴリ(「家族」、「芸術」、「科学」)で占められ、その後、よりプライベートなセクションに分割されます(たとえば、「科学」のカテゴリでは、「数学」のセクションを選択できます。 「物理学」、「歴史」)。セクションもコンポーネントパーツに分割され、その中にはさらに小さな要素があります。以下同様に、必要な情報がすでに配置されている最下位レベルまで続きます。
インターネットで情報を見つける2番目の方法キーワードに基づいています。すべてのユーザーリクエストには、関心のあるトピックに関連して最も繰り返される特定の数のトークンが含まれ、検索エンジンは、それらが最も頻繁に見つかるサイトのリストを提供します。
検索エンジンソフトウェアコンポーネント
インターネット上の情報の検索を容易にするため、およびユーザーに提供される情報の品質を向上させるために、インデックス作成モジュールに含まれるプログラムは常に改善されています。検索エンジンの作業プロセスは3つの段階に分かれており、それぞれの段階で特別に設計されたロボットが機能します。
- SpiderはWebページをダウンロードし、そこから含まれているすべてのリンクを抽出します。
- クローラー(「トラベリングスパイダー」)は、前の段階で抽出されたすべてのリンクを調べて、さらに検索する方向を決定します。
- インデクサーは、ダウンロードされたすべてのWebページを分析して、要求に含まれる情報に準拠しているかどうかを確認します。
検索エンジンハードウェア
検索エンジンの機能の重要な要素は、必要な情報を見つける品質と速度を保証するサーバーです。彼の仕事の最初の段階で、彼はユーザーの要求を分析します。ダウンロードされたすべてのファイルの分析結果がチェックされ、見つかったファイルに対するリクエストの対応に従ってランク付けされます。結果のリストは、ユーザーが指定した追加の検索条件によって調整できます。
前の段階の結果に基づいて、スニペット-見つかったソースへの注釈。リクエストに含まれる単語が強調表示されます。これは、ユーザーが検索結果ページに表示するスニペットです。
情報検索段階
まず、リクエストを作成する必要があります。この段階で、ユーザーは自分がどのような結果を望んでいるのかを明確に理解する必要があります。さらに、検索手順のコースが計画されています。それは情報を見つけるための戦略を指します。インターネットでは、このために、特定のサイトまたはそのカタログを使用して、既知のコンテンツをより徹底的に調査したり、既製のデータベース(たとえば、電子図書館)を表示したりできます。
最終段階で、検索結果ページに表示される結果から必要な情報が抽出されます。
検索テクニック
インターネット上で情報を検索するための一見基本的なルールでさえ、次のように無視することはできません。
- スペルチェック(最新の検索エンジンは間違いを自動的に修正しますが、リクエストが正しく行われなかった場合、結果が必要なものと異なる場合があります)。
- 検索ターゲットの定義(たとえば、リクエストによる)「ラップトップの修理、価格」ユーザーはコンピューターサービスのアドレスのリストを取得できますが、故障を修正するための正確な平均コストが必要でした。
- 必要な制限を設定する(たとえば、前の例では、検索の地理的領域を確立していなかった場合、検索エンジンはサンクトペテルブルクのラップトップの修理費用に関する情報をモスクワに住むユーザーに返すことができました)。
しかし、これらの原則を遵守していても、時には必要な情報を入手するのは難しいことがわかりました。インターネット上で情報を検索する機能は、ユーザーが要求を修正するための特別なスキルを持っていることを前提としています。
キーワード検索機能
検索バーにドライブする必要はまったくありません関心のある問題に関する詳細なエッセイ。いずれにせよ、システムは最も頻繁な単語を選択し、それらから始めて、結果を形成します。ただし、ブール演算子を使用して、目的の目標を絞り込むことができます。
「+」および「-」記号を使用すると、システムに次のことを要求できます。そのため、特定の単語が見つかったソースに存在するか、存在しない必要があります。必要な単語「ラップトップの修理+価格」と一緒にサインを書くことが重要です。
検索結果を文字通り一致させるにはリクエストするには、その横に感嘆符を付ける必要があります。 「!Price」のリクエストでは、サービスの費用に関連するサイトのみが提供され、子供のマチネのシナリオは提供されません。
フレーズと完全に一致する必要があるが、個別の単語ではなく、このフレーズは引用符で囲む必要があります。これは、引用の助けを借りて、有名人の作品全体または声明を見つける必要がある場合に特に役立ちます。
インターネット上の情報の高度な検索
以前のすべてのヒントが役に立たなかった場合目的の結果を得るには、各検索エンジンが提供する追加機能のいくつかを使用できます。特に、これは高度な検索の可能性に関係しています。
ユーザーには、いくつかのフィルターが提供されます。そのアプリケーションでは、指定された条件を調整できます。たとえば、クエリに含まれる単語の厳密なシーケンスを設定したり、ページ上の単語の場所を示したり、テキストへの入力形式を指定したりできます。特定のサイトなど、検索プロセスでシステムがターゲットにするテンプレートを設定することもできます。
高度な検索機能など地域だけでなく、関心のある出版の時間を設定する機会を提供します。ユーザーが特定のドキュメント(法律、規制、作品の出版物または史料)を探している場合、ユーザーは必要な形式をすぐに示すことができます。
その他の検索方法
Webに毎日アップロードされるデータの量増加します。論理コマンド、高度な検索、または特殊な情報検索スキルは、多くの場合、必要な情報を見つけるための多くのツールの1つにすぎません。
で情報を見つける他の方法インターネットは、Webページにあるハイパーリンクへの移行と呼ぶことができます。これにより、すでに見つかった情報を改良または拡張したり、新しい情報を発見したりできます。もう1つの一般的な検索方法は、画像によるものです。写真を検索エンジンにアップロードすることで、ユーザーはシステムを頼りに他の画像との一致を見つけ、人物、物体、または現象に関する必要な情報を提供できます。
最後に、その多くを忘れてはなりません企業や行政機関には独自のサイトがあり、必要な情報を含めることができるため、インターネット上で情報を見つけるプロセスが大幅に容易になります。