Для изъятия позиций в Яндексе у сеошников наиболее распространены 2 метода: парсинг результатов или использование XML. Использование Яндекс.XML реально удобней, т. к. это делается через API (хотя весной ввели ограничения), однако, бывает, что результаты xml-выдачи сильно отличаются от результатов обычного поиска. В связи с этим хотелось бы знать, насколько сильно отличаются позиции, полученные разными методами? В каких случаях использовать XML, а в каких Яндекс?
Этот анализ мы делали для того, чтобы выявить отличия между Яндексом и данными XML.
Проведения анализа
Анализ содержит 3 этапа:
1. Подбор запросов разного типажа.
Всего было использовано 240 запросов, среди которых выделены:
Витальные – по которым ищутся конкретные сайты (например, “викимарт” или “сайт Аллы Пугачевой”).
Коммерческие – в которых есть некая коммерческая направленность (например, “купить сервер” или “установка окон в ярославле”).
Общие – которые подразумевают различный интент пользователя (например, “линза” или “подарок”).
Информационные – когда юзер ищет оконкретную информацию (“как продвинуть сайт” или “зачем нужен пылесос”).
Медиа – которые касаются медиа-контента (“дрифт видео”, “стрижка волос фото”).
2. Сбор позиций из поиска Яндекса (регион “Ярославль”) и Яндекс.XML.
Для каждого случая собирался ТОП50 с акцентом на ТОП10 для поиска различий в разных ТОПах.
3. Расчет средней разницы по каждым сегментам и в целом между ТОПом и Яндекс.XML.
По каждому запросу рассчитывались изменения в выдаче по методу Оливера, затем просчитывалось усредненное значение по сегментам.
Результаты анализа
По витальным запросам выдача меняется несколько чаще. Это связано с тем, что Яндекс в результатах обычно показывает от 4 до 8 ссылок с одного ресурса, если запрос витальный. XML же при этом группирует результаты (в настройках был параметр maxpassages=5).
По коммерческим запросам разница была минимальна и составляла около 6-7%. В целом, по всем запросам различия были для ТОП10 – 9.76%, для ТОП50 – 9.14%.
Частота запроса по Wordstat'у напрямую не влияет на различие позиций в этих двух источниках данных, скорей различные показатели зависят больше от попадания в ту или иную группу частот витальных и иных запросов.
Для геозависимых и геонезависимых запросов сильного различия не замечено.
Однословники сильней влияют на отклонение, чем двусловники, но, возможно, это связано с общими запросами, т. к. обычно они содержат одно слово. Для семисловников результат не учитывался, потому что в эту группу попала всего одна фраза (“какие документы нужны для поступления в автошколу”).
Максимально и минимально изменяющие выдачу запросы.
Интересный момент, например, практически неизменная была выдача по следеющим запросам:
— как приготовить муравейник
— обзор планшетов
— авто обои на рабочий стол
— как продвинуть сайт
— мебель
— профессиональная уборочная техника
— доставка цветов
Но максимальные изменения (порядка 45-55%) дали такие запросы:
— сайт гостиница москва
— фото знаменитостей
— посуточная аренда Ярославль
— девушки обои
— аренда коттеджа посуточно
— гугл
— наша раша смотреть видео
Итак, Из 240 запросов
— 103 (42%) не поменяли ТОП10.
— 36 (15%) не поменяли ТОП50.
— 22 (9%) поменяли ТОП50 более чем на 20%.
Заключение
Системности особой не наблюдалось. По витальным запросам выдача может отличаться сильней, а по коммерческим не так сильно (6-7%). Однако, бывают единичные выдачи, дающие максимальное различие между позициями в XML и в поиске Яндекса.
В целом, если проверять через сервисы, использующие Яндекс.XML, стоит учитывать небольшую долю погрешности данных, которая может варьироваться в зависимости от тематики.