מה רלוונטיות

כשנכנסים לשאילתה בדף מנועי חיפושאו בסרגל החיפוש (בחלקו העליון של המסך) של הדפדפן מתחילים להתרחש אירועים המוסתרים ממשתמשים רגילים. כיצד המידע הדרוש ברשת הענקית ומה הרלוונטיות לחיפוש? המילה עצמה מגיעה מלטינית "רלוונטית" ומתורגמת לרוסית כ"להרים "או" להבהיר ". המקבילה האנגלית למונח היא "רלוונטיות". סעיף 3.5.1 של GOST 7.73-96 מפענח תפיסה זו, ול"רלוונטיות "ו"רלוונטית" יש אותה הגדרה, המורכבת מהתאמה של המידע שהתקבל לבקשת המידע שהגיש המשתמש.

תקן זה מכיל אחריםמונחים והגדרות סטנדרטיים שימושיים הנוגעים לתחום אחזור המידע והפצתו באמצעות מערכות מידע אינפורמטיביות. המסמך מסייע להבין את המשמעות של מילים רבות על מידע, פרסום או פעילויות הספרייה, ולא רק יחידת שפה כזו כמו "רלוונטיות". הגדרת המונחים "רלוונטיות" ו "רלוונטי" מוגדר גם בסעיף 3.5.2 של GOST 7.73-96. יש לפרש אותם כתכתובת של נתוני המידע שהתקבלו לצורך המידע. לעתים קרובות מושג זה הוא מבולבל עם הרלוונטיות, אשר הוא לא נכון ביסודו, שכן במקרה אחד הוא על ציות לבקשה, ובשני על ציות הביקוש. זה גם לא נכון לענות על השאלה: "מה רלוונטיות?" לומר כי המונח הזה הוא קרוב לרעיון של "הלימות", כלומר, היישום המעשי של התוצאה.

אך כיצד נמצא המידע?מנוע החיפוש משתמש בצבא של בוטים - תוכניות עצמאיות שמבקרות באתרים ושומרות מידע אודותיהן. שם זה בא מהמילה האנגלית "בוט", כלומר בקיצור "רובוט". תוכניות אלה מוצאות אתרים חדשים ואז עוברות לדף הבית ומציגות את תוכנו. בוטים לומדים דפים המקושרים לבית (הנטען תחילה בדפדפן) קישורים פנימיים. כמו כן, בוטים בוחנים קישורים שמפנים לאתרים אחרים, כלומר קישורים חיצוניים. על ידי שמירת מידע זה הם עוברים דרכם, מגלים אתרים חדשים ולומדים כיצד קשורים משאבי רשת זה לזה. לפיכך, הם לומדים ללא לאות את "המפה" של הרשת העולמית. אך מהי רלוונטיות? מה הקשר לבוטים?

עם דוגמה ספציפית, בואו נראה מה הם מציעיםמנועי החיפוש Yandex ו- Google. לשאלה "מהי רלוונטיות?" ל- Yandex 28 מיליון תגובות, ולגוגל 155 אלף תגובות. כאן אנו יכולים לומר שכולם נענים לבקשה, אך לא תמיד הצרכים, כלומר, לא כולם יהיו רלוונטיים. לדוגמא, דפים המסבירים מושג זה בקידום אתרים של ויקיפדיה ללא ספק יועילו, ואתר העוסק בעלויות רלוונטיות ולא רלוונטיות בקבלת החלטות אינו רלוונטי לנושא זה. דוגמה ממחישה יותר היא כאשר יאנדקס נתן 31 מיליון תגובות לבקשת "הידיים למעלה", שמשמעותה הייתה קבלת מידע על קבוצה מוזיקלית, וביניהם יש מאמר הקורא להרים ידיים למעלה, מכיוון שזה, על פי פיזיותרפיסטים, הוא שימושי מאוד. תשובה כזו לא יכולה להיחשב רלוונטית, אם כי היא מדורגת ב -586 מתוך 31 מיליון תשובות.

לפיכך, ככל שרלוונטיות הטקסט גבוהה יותר, כך יותרסביר יותר שהוא יכנס למיקומים הראשונים של תשובות החיפוש. לאינדיקטור זה יש הערכה כמותית, אך האלגוריתמים ליישומם עבור מנועי חיפוש שונים ואינם ידועים למשתמשים, והם משתנים גם עם הזמן, מכיוון שמנועי חיפוש, המנסים לעלות בדירוג, מנסים לספק מידע רלוונטי, ומקטינים את הגיע הזמן לחפש אותו. דפים רלוונטיים ביותר הם דפים שבהם המופע של מילת מפתח שתואמת לבקשה יכול לנוע בין 3 ל -7%. אך זה לא הקריטריון היחיד לרלוונטיות של מסמך. אלה כוללים מספר אינדיקטורים פנימיים וחיצוניים. אינדיקטורים פנימיים (למעט צפיפות מילות המפתח) הם מיקומם בטקסט (כניסה לכותרת, קרבתם לכותרת וזה לזה, עם היווצרות ביטויי חיפוש אפשריים), כמו גם נוכחות של מילים נרדפות, המאששות שתוכן הטקסט תואם לבקשה. האינדיקטור החיצוני העיקרי נחשב לפופולריות ברשת הגלובלית, אשר מצוין על ידי PageRank מגוגל, TIC של Yandex ו- Top100 של Rambler. כלומר, באיזו תדירות מבקרים בדף מאתרים אחרים, עדיף שיהיו להם דירוגים גבוהים. זה הרלוונטיות.