Почему дублирование контента – это плохо
Эта статья – вольный перевод одной статьи одного из буржуйских блогов. Настолько хорошей статьи, что я не поленился её стырить.
Белые вебмастера в статьях типа “130 советов по оптимизации сайта” нередко упоминают, что дублирование контента – это очень плохо. Другие кричат, что это всё бред и дублированный контент – это не страшно, всё равно поисковик всё проиндексирует и что-то там начнет показывать. И вот впервые я увидел аргументы, почему дублирование контента – это плохо. вот они:
Расходы на обход пауком
Сайтов в интернете много и всё проиндексировать – непростое дело. Поэтому паук лазит по вашему сайту не сколько нужно, а сколько позволено. Например, выделил Google на ваш сайт 1 минуту времени своего паука. Допустим, что одну страницу паук индексирует за 15 секунд. Итого, паук придет на ваш сайт и проиндексирует 4 страницы. Если при этом вторая страница будет копией первой (или это она же, просто доступна по ещё одному урлу), то паук, в действительности, проиндексирует 3 страницы. И пятая, хорошая и уникальная страница будет незаслужено ждать следующего пришествия паука.
Ссылочный вес
Итак, у нас несколько страниц с одинаковым контентом. Они постепенно обрастают бэками, которые… Ну, вы знаете, зачем нужны бэки… Так вот, естественные ссылки будут равномерно распределятся на эти страницы. Это плохо. Гораздо лучше было бы, если бы все такие ссылки вели на одну страницу. Тут вам и PR, и положение в выдаче и всё остальное. И не стоит надеяться на rel=canonical. Вообще, на что-то надеяться стоит только если иначе нельзя.
Страницы в выдаче
Итак, у нас несколько страниц с одинаковым контентом. Поисковик на них посмотрел и задумался. А какую из них засунуть в выдачу? А теперь вам вопрос: а какой шанс, что поисковик засунет в выдачу именно ту из страниц, какую надо? А если он засунет в выдачу дубль, а через неделю дублированая сраница пропадет (всякое бывает) – какой шанс, что поисковик засунет на её место в выдаче ту страницу, которую вы считаете оригиналом?
Выводы
Ох уж, эти вселенная, человеческая природа и ПС. Делают всё как надо только если не давать им другого выбора. А страницы с дублированым контентом – это и есть выбор. Именно поэтому они плохи.