Инструмент

Парсер Sitemap

Собирает URL из sitemap.xml и индекс-карт, показывает превью результата и даёт ссылки на скачивание, которые можно обновить, пока файл хранится на сервере. Подходит для быстрой проверки структуры сайта и подготовки списков URL для SEO-задач.

1
Фоновая обработка
Статус обновляется на странице, а превью и ссылки появляются сразу после завершения.
2
Подходит для больших карт
Есть лимиты и подсказки, чтобы не перегружать один запуск и сохранять стабильность.

Парсер Sitemap

Собирает все URL из переданных sitemap.xml и индекс-карт, показывает превью (до 50 URL) и даёт ссылки на выгрузку, пока результат хранится на сервере. Подходит для быстрой проверки структуры сайта и подготовки списков URL для дальнейшей обработки.

Что важно знать перед запуском:
  • До 30 корневых sitemap за один запуск.
  • До 500000 уникальных URL в одном результате.
  • Глубина обхода индекс-карт: до 2 уровней.
  • Если сайт очень большой, лучше разбивать парсинг на несколько запусков.
Готовый результат хранится на сервере 7 дней. Скачать его лучше заранее, если он ещё понадобится позже.
Назад к инструментам
Пример ввода:
https://example.com/sitemap.xml
https://example.com/sitemap_news.xml
https://shop.example.com/sitemap.xml.gz

Как это работает

  1. Вставьте по одному URL sitemap.xml на строку (поддерживаются .xml и .xml.gz).
  2. Нажмите «Запустить парсинг» — индекс-карты (<sitemapindex>) раскроются автоматически.
  3. После завершения посмотрите превью первых 50 URL и скачайте полный результат по временным ссылкам.

Если сайтмап недоступен (например, 404 или приватный доступ), статус появится в уведомлениях консоли сервера; итоговый список формируется из успешно обработанных карт.

Что на выходе

  • CSV/TXT со списком уникальных URL, отсортированных по доменам.
  • Превью: первые 50 URL для визуальной проверки.
  • Дата/время парсинга и источник могут учитываться в служебных логах сервера для диагностики.

Поддержка и лимиты

  • Поддерживаются обычные карты (<urlset>) и индекс-карты (<sitemapindex>), включая сжатые .xml.gz.
  • За один запуск можно передать до 30 корневых sitemap.
  • Рекурсивный обход индекс-карт ограничен глубиной 2 и максимум 250 вложенными sitemap за запуск.
  • Ограничение результата: до 500000 уникальных URL за один job.
  • Один sitemap-ответ ограничен размером примерно до 25 MB, чтобы не перегружать сервер.
  • Стандарт протокола Sitemap: до ~50 000 URL на один файл и до ~50 МиБ несжатого XML, но на практике лучше разбивать очень большие наборы на несколько запусков.
Пример индекс-карты:
<sitemapindex>
  <sitemap><loc>https://example.com/sitemap-1.xml</loc></sitemap>
  <sitemap><loc>https://example.com/sitemap-2.xml.gz</loc></sitemap>
</sitemapindex>

Приватность

  • Введённые URL не сохраняются по завершении сессии.
  • Скачиваемые файлы размещаются временно и удаляются через 30 минут.

Подсказки

  • Один URL на строку.
  • Если видите мало URL — проверьте, не указывает ли sitemap.xml на пустые разделы, дубликаты поддоменов или закрытые секции.
  • Для очень больших сайтов разбивайте список сайтмапов на несколько запусков.