Какво представлява индексирането на сайта?Как върви? Можете да намерите отговори на тези и други въпроси в статията. Уеб индексиране (индексиране в търсачките) се отнася до процеса на прикачване на информация за сайт към база данни като робот за търсачки, който впоследствие се използва за търсене на информация за уеб проекти, които са преминали през такава процедура.
Данните за уеб ресурси най-често се състоят отключови думи, статии, връзки, документи. Аудиото, изображенията и т.н. също могат да бъдат индексирани. Известно е, че алгоритъмът за идентифициране на ключови думи зависи от търсачката.
Има някои ограничения за видовете индексирана информация (флаш файлове, javascript).
Управление на участието
Индексирането на сайтове е сложен процес.За да го контролирате (например, забранете изпращането на определена страница), трябва да използвате файла robots.txt и такива предписания като Allow, Disallow, Crawl-delay, User-agent и други.
Също така за индексиране се използват етикетите <noindex> и атрибут <nofollow>, които скриват съдържанието на ресурса от роботи на Google и Yandex (Yahoo използва маркера <nofollow>).
В търсачката Goglle новите сайтове се индексират от няколко дни до една седмица, а в Yandex - от една седмица до четири.
Искате вашият сайт да се показва в заявкирезултати от търсачката? Тогава той трябва да бъде обработен от Rambler, Yandex, Google, Yahoo и т.н. Трябва да информирате търсачките (паяци, системи) за съществуването на вашия уебсайт и след това те ще го обхождат изцяло или частично.
Много сайтове не са индексирани от години. Информацията, която е на тях, не се вижда от никой, освен от собствениците им.
Методи за обработка
Индексирането на сайтове може да се извърши по няколко начина:
- Първата опция е да добавите ръчно. Трябва да въведете данните за вашия сайт чрез специални формуляри, предлагани от търсачките.
- Във втория случай самият робот на търсачкатанамира вашия уебсайт от връзки и го индексира. Той може да намери вашия сайт чрез връзки от други ресурси, които водят до вашия проект. Този метод е най-ефективен. Ако търсачката намери сайт по този начин, той го смята за значим.
условия
Индексирането на сайтове е бавно.Условията са различни, от 1-2 седмици. Връзките от авторитетни ресурси (с отличен PR и Tit) значително ускоряват поставянето на сайта в базата данни на търсачката. Днес Google се смята за най-бавния, въпреки че до 2012 г. може да свърши тази работа за една седмица. За съжаление нещата се променят много бързо. Известно е, че Mail.ru работи с уебсайтове в тази област от около шест месеца.
Индексиране на сайта в търсачките за извършванене всеки специалист е способен. Времето за добавяне на нови страници към базата данни на сайт, който вече е обработен от търсачките, се влияе от честотата на коригиране на съдържанието му. Ако ресурсът се появява постоянно с нова информация, системата смята, че той често се актуализира и е полезен за хората. В този случай работата й се ускорява.
Можете да следите напредъка на индексирането на уебсайт в специални раздели за уебмастъри или в търсачките.
промени
И така, вече разбрахме как се случваиндексиране на сайтове. Трябва да се отбележи, че базите данни на търсачките се актуализират често. Следователно броят на добавените към тях страници от вашия проект може да се промени (както да намалява, така и да се увеличава) поради следните причини:
- санкции на търсачката срещу уебсайта;
- наличие на грешки в сайта;
- промени в алгоритмите на търсачката;
- отвратителен хостинг (недостъпност на сървъра, на който се намира проектът) и т.н.
Yandex отговаря на често срещани въпроси
Yandex е търсачката, използвана отмного потребители. Тя се нарежда на пето място сред световните системи за търсене по брой обработени заявки за изследвания. Ако сте добавили сайт към него, добавянето към базата данни може да отнеме твърде много време.
Добавянето на URL адрес не гарантира, че той ще бъде индексиран.Това е само един от методите, чрез които роботът на системата се информира, че се е появил нов ресурс. Ако има малко или никакви връзки към сайт от други сайтове, добавянето му ще ви помогне да го намерите по-бързо.
Ако индексирането не е настъпило, трябва да проверите далидали е имало грешки на сървъра по време на създаването на приложение за него от робота Yandex. Ако сървърът съобщи за грешка, роботът ще прекрати работата си и ще се опита да я извърши в обратен ред. Служителите на Яндекс не могат да увеличат скоростта на добавяне на страници към базата на търсачката.
Индексирането на сайт в Yandex е достатрудна задача. Не знаете как да добавите ресурс към търсачката? Ако има връзки към него от други уебсайтове, няма нужда да добавяте специален сайт - роботът автоматично ще го намери и индексира. Ако нямате такива връзки, можете да използвате формуляра „Добавяне на URL“, за да информирате търсачката за съществуването на уебсайта.
Моля, не забравяйте, че добавянето на URL адрес не гарантира индексиране на вашето създаване (или неговата скорост).
Много хора се чудят колко време отнемаиндексиране на сайтове в Yandex. Служителите на тази компания не дават гаранции и не предвиждат условия. Като правило, тъй като роботът е разбрал за сайта, неговите страници в търсенето се появяват след два дни, понякога след няколко седмици.
Процес на обработка
Yandex е търсачка, която изисква прецизност и внимание. Индексирането на сайта се състои от три части:
- Роботът обхожда страниците на ресурса.
- Съдържанието (съдържанието) на сайта се записва в базата данни (индекс) на системата за търсене.
- След 2-4 седмици, след актуализиране на базата данни, можете да видите резултатите. Вашият сайт ще се появи (или няма да се появи) в резултатите от търсенето.
Проверка за индексиране
Как да проверя индексирането на даден сайт? Това може да стане по три начина:
- Въведете името на вашия бизнес в редатърсачка (например „Yandex“) и проверете всяка връзка на първата и втората страница. Ако намерите URL адреса на вашето въображение там, тогава роботът е изпълнил задачата си.
- Можете да въведете URL адреса на вашия сайт в полето за търсене. Ще можете да видите колко интернет списъци са показани, т.е. индексирани.
- Регистрирайте се на страниците за уеб администратори вMail.ru, Google, Yandex. След като преминете проверката на сайта, ще можете да видите резултатите от индексирането и други услуги на търсачката, създадени за подобряване на ефективността на вашия ресурс.
Защо Yandex отказва?
Сайтът е индексиран от Googleкакто следва: роботът въвежда в базата данни всички страници на сайта, нискокачествени и висококачествени, без да избира. Но в класирането участват само полезни документи. И „Яндекс“ изключва всички уеб кошчета наведнъж. Той може да индексира всяка страница, но търсачката в крайна сметка ще премахне всички боклуци.
И двете системи имат допълнителен индекс.И двете страници с ниско качество оказват влияние върху общото класиране на уебсайта. Тук работи проста философия. Любимите ресурси на определен потребител ще заемат по-високи позиции в резултатите от търсенето му. Но същият човек едва ли ще намери сайт, който не му е харесал последния път.
Ето защо, първо, е необходимо да се прикрият копия на уеб документи от индексиране, да се провери наличието на празни страници и да не се допуска некачествено съдържание в издаването.
Ускорете Yandex
Как можете да ускорите индексирането на сайт в Yandex? Следвай тези стъпки:
- Инсталирайте браузъра Yandex на компютъра си и го използвайте, за да разглеждате страниците на сайта.
- Потвърдете правата за управление на ресурса в Yandex.Webmaster.
- В Twitter публикувайте връзка към статията. Известно е, че от 2012 г. Yandex си сътрудничи с тази компания.
- За сайта добавете търсене от Yandex. В секцията Индексиране можете да посочите свои собствени URL адреси.
- Въведете кода на Yandex.Metrica, без да поставите отметка в квадратчето „Изпращането на страници за индексиране е забранено“.
- Генерирайте съществуваща карта на сайтасамо за робота и не се вижда от публиката. Проверката ще започне с него. Адресът на картата на сайта се въвежда в robots.txt или в подходяща форма в „Уеб администратор“ - „Настройки за индексиране“ - „Файлове на карта на сайта“.
Междинни действия
Какво трябва да се направи, докато уеб страницатаНе е ли индексиран от Yandex? Вътрешната търсачка трябва да разглежда сайта като основен източник. Ето защо още преди публикуването на статия е наложително съдържанието й да се добави към формуляра „Специфични текстове“. В противен случай плагиаторите ще копират записа в своя ресурс и ще бъдат първи в базата данни. В резултат на това те ще бъдат признати за автори.
База данни на Google
За Google са подходящи същите препоръки, които описахме по -горе, само услугите ще бъдат различни:
- Google+ (заменя Twitter);
- Google Chrome;
- Притурки на Google за програмисти - „Сканиране“ - „Прилича на Googlebot“ - „Сканиране“ - опция „Добавяне към индекса“;
- търсене в ресурс от „Google“;
- Google Analytics (вместо Yandex.Metrica).
Забрана
Какво е забрана за индексиранесайт? Можете да го наслагвате или върху цялата страница, или върху отделна част от нея (връзка или част от текста). Всъщност съществува както глобална забрана за индексиране, така и локална. Как се прилага това?
Помислете за забраната за добавяне на търсачка на уебсайт към базата данни в Robots.txt. Използвайки файла robots.txt, можете да изключите индексирането на една страница или цяла категория ресурс като тази:
- Потребителски агент: *
- Забрани: /kolobok.html
- Забрани: / foto /
Първата точка казва, че инструкциитеса дефинирани за всички PS, втората показва забраната за индексиране на файла kolobok.html, а третата не позволява добавянето на цялото запълване на папката foto към базата. Ако трябва да изключите няколко страници или папки, посочете всички от тях в „Робот“.
За да се обезкуражи индексиранетоотделна брошура, можете да приложите роботите. Той се различава от robots.txt по това, че дава инструкции на всички търсачки наведнъж. Този мета маркер се подчинява на общите принципи на html формата. Трябва да се постави в заглавката на страницата между маркерите <head> <head>. Например запис за забрана може да бъде написан така: <meta name = ”robots” content = ”noindex, nofollow”>.
Аякс
Как Yandex индексира Ajax сайтове?Много разработчици на уебсайтове използват Ajax днес. Разбира се, тя има големи възможности. С него можете да създавате бързи и ефективни интерактивни уеб страници.
Роботът на търсачката обаче „вижда“ уеб списъкане харесва потребителя и браузъра. Например, човек разглежда удобен интерфейс с подвижно заредени интернет списъци. За робот съдържанието на същата страница може да бъде празно или представено като останалото статично HTML съдържание, за генерирането на което скриптове не се използват.
C # URL адресите могат да се използват за създаване на Ajax сайтове,но неговият робот за търсене не го използва. Обикновено частта от URL адреса след # се отстранява. Това трябва да се има предвид. Следователно, вместо URL като http://site.ru/#example, той прави заявление към главната страница на ресурса, намираща се на http://site.ru. Това означава, че съдържанието на уеб списъка може да не бъде включено в базата данни. В резултат на това той няма да се показва в резултатите от търсенето.
За подобряване на индексирането на сайтове на AjaxYandex поддържа промени в робота за търсене и правилата за обработка на URL адреса на такива уебсайтове. Днес уеб администраторите могат да посочат на търсачката Yandex необходимостта от индексиране, като създадат съответна схема в структурата на ресурсите. Това изисква:
- Заменете символа # с #! В URL адресите на страницата. Сега роботът ще разбере, че може да кандидатства за HTML версия на съдържанието на този уеб списък.
- HTML версията на съдържанието на такава страница трябва да бъде поставена на URL адрес, където #! заменен с? _escaped_fragment_ =.