Какие сайты могут быть проиндексированы в поисковиках?
Для того чтобы найти ответ на данный вопрос, необходимо разобраться и найти ответы на другие вопросы.
Доменные имена.
Для того чтобы ориентироваться в возможностях индексации того или иного поисковика необходимо определить зону их действия. Также стоит ли добавлять свои сайты в тот или иной поисковик. Для русских сайтов востребованными поисковыми сервисами являются Яндекс и Рамблер, которые работают только на территории Рунета (Русского Интернета). Поэтому доменное имя таких сайтов должно находиться в зоне ru. Также эти поисковики добавляют такие сайты, как com, info и других расширений. Эти поисковики добавляют также сайты, на которые ведут ссылки с уже известных ресурсов.
Google – является глобальной поисковой машиной и он принимает к индексации любые сайты, в любой доменной зоне.
Индексация документов поисковой системой.
Первые поисковые машины индексировали только тексты, оформленные на языке HTML, то есть странички Интернета, которые отображаются веб-сервером по протоколу http. Далее разработчики поисковых систем увидели, что в Интернете находится огромное количество различных материалов в формате статей, прайс-листов, документации и т.д. Поэтому многие поисковые машины были модернизированы для работы с документами в формате MS WORD, PDF, MS EXCEL и т.д. Также многие поисковики индексируют информацию скрытую в формате Flash.
Но стоит вас огорчить, поисковые машины не всегда качественно индексируют перечисленные выше форматы и полагаться на этот метод не стоит. Лучше сделайте дубль данного документа в формате HTML и разместите его на сайте.
Если на сайте вы размещаете прейскурант в EXCEL, то сделайте дубль данного документа в HTML, так как до EXCEL поисковая машина может и не дойти. Такой документ может некорректно отображаться в результатах поиска, так робот не обучен разбирать структуру файлов excel, так как он это делает с html-документами.
Также хочется расстроить любителей вывода динамических текстов на страницы при помощи JavaScript, так как такая информация не индексируется поисковыми системами. Также не видны для поисковика тексты в графическом стиле.
Показатели индексации сайтов.
Многих владельцев сайта интересует вопрос, насколько глубоко может погрузиться поисковый робот на сайте? Существуют какие-либо ограничения или лимиты поисковых систем?
Если верить теории, то такие ограничения отсутствуют, но практически поисковый робот не соизволит выкачать миллионы ваших страниц с сайта. Ведь поисковик выкачивает информацию с сайтов по списку, в порядке «живой» очереди. А ведь в этой очереди стоят миллионы сайтов. Поэтому поисковый робот за один проход по сайту пытается взять некоторое количество страниц для индексации. И так он начинает посещать ваш сайт и выкачивать с него информацию определенными порциями. Чтобы «не надорваться» поисковик не погружается в пучины вашего сайта. Он берет регулярно по порции.
Поэтому, если ваш сайт большой, то не делайте такие страницы, до которых необходимо добираться, минуя цепочку из 10 ссылок.
Индекс баз данных.
Обычно сайты большого содержания хранят свои страницы в базе данных, например, MySQL. Это удобный механизм хранения, обновления и сохранения страниц сайта. Возникает вопрос, как поисковые машины относятся к таким сайтам?
Если странички сайта появляются с базы данных при переходе по внутренним или внешним ссылкам, которые ссылаются на определенный материал, то поисковику все равно откуда они возникают при таком переходе. Неважно от куда берется страничка, поисковый робот все равное ее проиндексирует, так как на нее ведет ссылка. Если же пользователь, чтобы перейти на определенную страничку должен вводить запрос к базе данных, то робот не может увидеть такие странички.
Давайте рассмотрим пример. Допустим у вас на сайте расположена онлайн-энциклопедия, которая содержит к примеру 100 000 статей. Все статьи размещены в алфавитном порядке. Сохранять такое количество статей по отдельности и редактировать их HTML форматы очень неудобно. Поэтому такое количество статей лучше хранить в базе данных, где предварительно создается таблица материалов.
Теперь вы подали свой сайт на индекс в поисковые системы. Если вы на сайте разместите полное оглавление вашей энциклопедии, в виде иерархического списка или в виде алфавитного указателя. Также можно оформить данные материал в виде линейного списка – заголовков статей. Каждому заголовку будет присвоена ссылка. Тогда поисковая машина проиндексирует все ваши статьи. Конечно, это произойдет не за один раз, а за несколько проходов робота, но в конечном итоге – все страницы попадут в индекс.
Если автор сайта не захотел сделать такой список или оглавление своей энциклопедии, а пользователю, чтобы найти данный материал необходимо пользоваться поиском, который выбирает материал из базы данных по заданному запросу, который входит в оглавление статьи или в саму статью. Такая возможность поиска существует во всех версиях баз данных.
Но поисковик – это бот, который не знает того, что знаем мы. Он не наберет нужного запроса в поиске, а вместо этого зайдет на сайт и не обнаружив новых ссылок, отправится индексировать дальше другие сайты из своего списка. Форма поиска не является ссылкой на другие страницы сайта, поисковик игнорирует этот механизм. В данной ситуации поисковик проиндексирует только титульную страницу вашей энциклопедии, на которой расположена форма поиска. А весь основной материал останется без внимания и не попадет в индекс.
Запомните, что поисковый бот будет индексировать на вашем сайте, только гипертекстовые ссылки и скачивать только те страницы, на которые эти ссылки ведут. Он не увидит большие базы данных, которые работают только за счет формы поиска. И не зря говорят о глубине Интернета, до дна которого поисковые роботы не добираются.
-
Что нам дает качество сайта? Методика подбора ключевых слов для поисковиков Бесплатно ускоряем индексацию сайтов Какие сайты могут быть проиндексированы в поисковиках? Реклама в соцсетях Розкручування сайту в пошукових системах - практична конференция Что такое root? Просування сайту - аудит Kinect попал в продажу уже взломанным. PHP в Web-приложениях. Внимание, каталог CGI-BIN! Индексация ссылок Сеть сайтов:что такое хорошо, что такое плохо? Пользователь = запрос. Как измерить имидж сайта? Кто может заработать в интернете? Стратегия низкобюджетного продвижения сайтов в поисковиках Раскручиваем сайт в поисковых системах SEO WordPress - оптимизация ссылок Как выбрать партнерку?
[21.12.2011] | |
Определение главного зеркала сайта с помощью панели Яндекс.Вебмастер (25) |
[21.12.2011] | |
UXcamp Dnepropetrovsk 2011 (0) |
[17.01.2012] | |
Дюжина ошибок сисадмина (0) |
[17.01.2012] | |
Компания с нуля (0) |
[22.01.2012] | |
Создаем сайт на MotoCMS (1) |
Комментариев нет