Про sitemap.xml

1.35K
.
Кадило крутится, лавэха мутится
# MARAZM (21.08.2016 / 20:58)
да простенький генератор с того же зц симбы сделать вообще не проблема даже новичку.такой вопрос если у меня боле 20000 ссылок в нембудет беда?
В одном файле должно быть не более 50 000 ссылок. Разбивать на части надо если больше.
Да и вообще всё лучше разбивать логически по файлам.
.
(\/)____o_O____(\/)
Simba, Каждый текстовый файл может содержать не более 50 000 URL, и его размер не должен превышать 10 МБ (10 485 760 байт). Если сайт включает более 50000 URL, можно разделить этот список на несколько текстовых файлов и передать каждый файл отдельно.
.
(\/)____o_O____(\/)
http://www.sitemaps.org/ru/protocol.html
вот впринципе все доступно описано, я когда то курил глобально, написал свой парсер с базы и конструктор карты
.
КИДАЛА!!! Дел не иметь!
Koenig, ну вот у симбы в зц сайтма идет download-1.xml и так далее. тоесть нужен обычный файл sitemap.xml в котором будут ссылки на разбитые файлы?
.
(\/)____o_O____(\/)
MARAZM, там по ссылке все есть, как разбить, какие файлы создать, как и зачем...
.
Кадило крутится, лавэха мутится
# MARAZM (22.08.2016 / 16:49)
Koenig, ну вот у симбы в зц сайтма идет download-1.xml и так далее. тоесть нужен обычный файл sitemap.xml в котором будут ссылки на разбитые файлы?
Вот для примера можешь посмотреть http://symbos.su/sitemap.xml
.
Sitego
Enter нажат, к чему теперь рыданья…
Посмотрел на нескольких крупных новостных сайтах, а именно они лучше и быстрее индексируются, чем все остальные сайты в инете. У них либо вообще нет карты сайта, либо вот такого плана:
sitemap.xml новостного сайта (+/-)

В общем, у большинства крупных сайтов, в качестве карты для посиковиков служит обычная RSS лента.

Если рассуждать логически
1. Для чего нужна карта сайта? - Для быстрого индексирования нового контента (о старом поисковики и так знают).
2. Что нужно для быстрой индексации? - Постоянно обновляющаяся страница (лента) с ссылками на новый контент. Это может быть просто главная страница, на которой каждый день появляются новые статьи и ссылки, как это реализовано в блоговых движках или на новостных сайтах.

Вывод
1. Если на сайте нет постоянно обновляющегося контента, то sitemap.xml этому сайту, как мёртвому припарка.
2. Если на сайте каждый день добавляется новый контент и его видно на главной или в RSS ленте, sitemap.xml для сайта - аналогично первому пункту.
3. Если на сайте статичная главная страница, нет RSS ленты, нет вообще никакой страницы (не далее второго уровня вложенности) с ссылками на новый контент, то этому сайту нужна карта sitemap.xml
.
2. Если на сайте каждый день добавляется новый контент и его видно на главной или в RSS ленте, sitemap.xml для сайта - аналогично первому пункту.

а так же если это хлам бесполезный для наращивания поискового трафика
20000 спарсенных анекдотов,10000 статусов,постоянно обновляющийся раздел пабликов вк в котором за 2 недели уже 6000+ записей
.
замусоривание приведет к снижению скорости индексации полезного контента, боты имеют свои ограничения на кол-во запросов в сек, ми, час, день
.
(\/)____o_O____(\/)
ramzes, но они с радостью добавляют в очередь ссылки, сам добавлял около 200к ссылок и следил за процессом
Всего: 27