
Сторінка-сирота – це сторінка на сайті, яка не має батьківських посилань. Іншими словами, вона існує, але внутрішніх посилань на неї немає. Таким чином, її не можна знайти ні користувачем, ні пошуковою системою.
Чому вони важливі?
Невелика кількість сторінок-сиріт є звичайним явищем і не є великою проблемою, проте, в масштабі, вони можуть зробити свій внесок у витрату краулінгового бюджету, призвести до канібалізації або просто поганої роботи, якщо сторінка є застарілою.
З цього туторіалу Ви дізнаєтесь, як за допомогою Screaming Frog SEO Spider знайти сторінки-сироти із трьох джерел: XML Sitemap, Google Analytics та Search Console.
1. Виберіть ‘Crawl Linked XML Sitemaps’ у розділі ‘Configuration > Spider > Crawl’
Щоб сканувати Sitemap.XML, ви можете вибрати автоматичне виявлення через директиву robots.txt або вказати url адресу карти сайту xml.
2. Підключіться до Google Analytics у розділі Configuration > API Access
Ви можете підключитися до Google Analytics API та отримати дані безпосередньо під час сканування. Щоб знайти сторінки-сироти з органічного пошуку, не забудьте вибрати "Organic Traffic".
Ви можете встановити діапазон дат для аналізу, який в ідеалі повинен становити не менше місяця, а також інші показники, які краще залишити за промовчанням. Сегмент можна налаштувати на "Всі користувачі" або "Платний трафік", якщо ви хочете знайти сторінки-сироти через інші джерела.
3. Виберіть "Crawl New URLs Discovered In Google Analytics"
Якщо цей параметр не увімкнено, нові URL-адреси, виявлені за допомогою Google Analytics, будуть доступні лише для перегляду у звіті "Сторінки-сироти". Вони не будуть додані в чергу сканування, доступні для перегляду та відображаються під відповідними вкладками та фільтрами.
4. Підключіться до GSC у «Configuration > API Access»
Ви можете підключитися до API Google Search Console і отримувати дані, такі як покази, кліки, CTR та позиції безпосередньо під час сканування. Все це для того, щоб знайти втрачені сторінки, які отримують покази та кліки у пошуку, але не мають внутрішніх посилань.
За датами аналогічно з Google Analytics – не менше місяця.
5. Виберіть "Crawl New URLs Discovered In Google Search Console"
Знову ж таки, якщо цей параметр не включений, нові URL-адреси, виявлені за допомогою GSC, будуть доступні тільки для перегляду у звіті "Сторінки-сироти". Вони не будуть додані в чергу сканування, доступні для перегляду та відображаються під відповідними вкладками та фільтрами.
6. Запускаємо сканування
На цьому етапі складнощів не повинно бути.
Можна стежити за ходом роботи API на вкладці.

Дочекайтеся повного 100% сканування.
7. Натисніть "Crawl Analysis > Start", щоб знайти сторінки-сироти
Більшість фільтрів у SEO Spider доступні для перегляду під час сканування. Однак на вкладках "Sitemaps", "Analytics" та "Search Console" є три відповідні фільтри "Сторінки-сироти (Orphan urls)", які можна переглянути тільки в кінці сканування.
Після закінчення всі дані можна переглянути у відповідній вкладці.

8. Аналізуйте сторінки-сироти на вкладках «Sitemap», «Analytics» та «Search Console»
Тепер ви можете переглядати кожну вкладку та відповідний фільтр 'Orphan URLs', щоб знайти сторінки-сироти. Наприклад, у нашому випадку є кілька сторінок, які знайшла Google Аналітика.

У нашому випадку всі сторінки віддають 404 коди, але бувають випадки і з 200.
Що робити з такими сторінками – вирішувати вже вам, або звертайтесь до нас. Ми допоможемо.