Методология Prodactor: как мы исследуем нишевые сайты в ТОПе Яндекса

В информации про сайты для местного бизнеса полно мифов. Наверное, вы их слышали: «на сайте обязательно должен быть слайдер с фотографиями», «нужен онлайн-консультант, который встречает посетителя вопросом», «главная страница должна быть длинной и подробной». Эти убеждения кочуют из статьи в статью, из брифа в бриф. Но что, если проверить их не на словах, а на деле? Что, если взять не абстрактные советы, а реальные сайты, которые уже победили в конкурентной борьбе?

Мы в Prodactor решили не гадать, а исследовать. Прежде чем создавать готовые сайты для местного бизнеса, мы захотели досконально понять, как устроены успешные сайты, попавшие в ТОП Яндекса в органической выдаче. В качестве первого полигона мы взяли нишу кафе — одну из самых конкурентных и показательных. Отобрали 50 сайтов в городах-миллионниках, разобрали их до винтика и выяснили, что на самом деле работает.

В этой статье мы публично раскрываем свою методологию. Почему мы отбираем сайты именно так, как их сохраняем, как обрабатываем с помощью искусственного интеллекта и почему в итоге работаем только с лучшими сайтами — с тем, что попадает в ТОП.

Содержание:

Зачем мы это делаем

Наша логика проста и прагматична. Если сайт попал органическим способом на первую страницу Яндекса по конкурентному запросу в городе-миллионнике — значит, он что-то делает правильно. Поисковая система уже отобрала лучших. У них есть чему поучиться.

Простыми словами: мы не хотим изобретать велосипед. Мы хотим посмотреть на те велосипеды, которые едут быстрее всех, и понять, как они устроены. Это не копирование, это исследование лучших практик.

Технические детали: мы исходим из гипотезы, что позиции в органической выдаче коррелируют с качеством сайта с точки зрения пользователей и поисковых алгоритмов. Разумеется, мы исключаем факторы возраста домена и накопившейся за годы популярности — такие сайты мы отсеиваем на этапе отбора. Нас интересуют только современные решения, которые работают здесь и сейчас.

Цель исследования — не скопировать чужие сайты, а выявить глубинные закономерности. Что объединяет сайты из ТОПа Яндекса? Какие страницы есть у всех? Какие функции встречаются чаще других? А что, вопреки стереотипам, вообще никто не использует?

В качестве первого примера мы взяли нишу кафе. Но методика универсальна. Точно так же мы будем исследовать автосервисы, салоны красоты, клининговые компании и любой другой местный бизнес. Результатами мы делимся открыто. Пусть пользуются все — владельцы бизнеса, маркетологи, веб-разработчики. Нам не жалко.

Как мы отбирали сайты

Самое важное в любом исследовании — чистота выборки. Если намешать всего подряд, результаты будут бессмысленными. Поэтому мы ввели жёсткие критерии отбора и безжалостно отсеивали всё, что могло исказить картину.

Простыми словами: мы не брали всё подряд. Мы отбирали только те сайты, которые действительно интересны владельцу обычного городского кафе. Никаких сетей, никаких фудкортов, никаких одностраничников.

Технические детали: в выборку сознательно не попали несколько категорий сайтов.

Одностраничники.
Это не сайты в полном смысле слова, а скорее визитки. Нам этот сегмент неинтересен, потому что он не отражает реальные возможности веб-разработки для бизнеса.
Сайты сетевых заведений.
У крупных сетей другие бюджеты, другие задачи, другие команды. Они не ориентир для обычного кафе.
Кафе в торговых центрах и фудкортах.
У этих заведений специфический трафик — они работают на посетителях ТЦ, и их сайты решают другие задачи. Нам нужны отдельно стоящие кафе.
Кафе при развлекательных центрах, отелях, фитнес-клубах. Та же история — зависимый от трафика бизнес, который не отражает ситуацию в нише в целом.
«Динозавры».
Сайты, которые попали в ТОП только за счёт возраста и накопленной популярности, но при этом выглядят как привет из нулевых. Мы ищем современные решения, которые работают сегодня.
Города вне списка.
Мы ограничились миллионниками, чтобы выборка была однородной по уровню конкуренции. Сайт из города с населением 50-100 тысяч человек не сопоставим с сайтом из города с населением 1 миллион человек и более.

После всех фильтров мы получили 50 сайтов, которые и легли в основу исследования. Все они отобраны по единым правилам:

Города: Новосибирск, Екатеринбург, Казань, Красноярск, Нижний Новгород, Челябинск, Омск, Самара, Уфа, Ростов-на-Дону, Воронеж, Волгоград, Пермь.
Поисковый запрос: «кафе сайт». Мы выбрали максимально широкий запрос, чтобы собрать все виды заведений — от небольших кафе до банкетных залов.
Глубина: только первая страница органической выдачи Яндекса. Никакой рекламы (промо), только прямые ссылки на сайты кафе. Для каждого города получилось собрать 3 — 6 ссылок.

Как мы сохраняли сайты

Когда 50 кандидатов были отобраны, встал технический вопрос: как зафиксировать их состояние, чтобы можно было спокойно анализировать, не боясь, что владелец сайта завтра всё переделает? Живые сайты меняются постоянно: правки вносятся ежедневно, дизайны обновляются, контент добавляется и удаляется. Нам нужен был «слепок реальности» — точная копия каждого сайта на момент исследования.

Простыми словами: мы скачали все 50 сайтов целиком, чтобы они не изменились, пока мы их изучаем. Теперь у нас есть архив, к которому можно вернуться через месяц или через год.

Технические детали: для сохранения мы использовали утилиту single-file. Это инструмент, который позволяет сохранить список веб-страниц сайта в набор файлов вместе с текстом и структурой. Команда выглядела так:

single-file --urls-file "C:\Prodactor\download\links.txt" --output-directory "C:\Prodactor\download" --browser-wait-until=load --browser-load-max-time=30000 --block-stylesheets --block-images --remove-scripts

Где C:\Prodactor\download\ — папка для сохранения файлов сайта.

Разберём ключевые параметры, потому что они важны для понимания чистоты эксперимента.

--browser-wait-until=load и --browser-load-max-time=30000 говорят утилите: не спеши, подожди до 30 секунд, пока сайт полностью загрузится, выполни весь JavaScript, покажи весь динамический контент. Это гарантирует, что мы сохраняем сайт именно в том виде, в котором его видит обычный посетитель.

--block-stylesheets и --block-images отключают сохранение внешних стилей и изображений. Нам важна структура, тексты, ссылки, формы, а не картинки и красивости, которые занимают много места. У нас в итоговом файле остаётся чистая и лёгкая суть сайта.

--remove-scripts удаляет исполняемые скрипты. Это делает сохранённый файл абсолютно безопасным и статичным — он больше не пытается никуда отправить запросы, ничего не грузит, просто лежит на складе в виде груза, идеальным для анализа.

На выходе мы получили 50 компактных наборов файлов, каждый из которых содержит полную структуру сайта со всеми текстами, но картинок, стилей и тяжеловесных скриптов. Причем все файлы были получены практически одновременно, что позволяет говорить о снимке состояния исследуемых файлов.

Как мы обрабатывали сайты

Следующий этап — самый трудоёмкий. Иметь 50 папок (наборов файлов) мало, нужно превратить их в структурированные данные, пригодные для подсчётов и сравнения. Делать это вручную — недели кропотливой работы. Здесь нам на помощь пришёл искусственный интеллект.

Простыми словами: мы научили нейросеть разбирать сайты по полочкам и заполнять анкеты. Получилось быстро, единообразно и без ошибок.

Технические детали: для каждого из 50 сохранённых наборов файлов мы запускали ИИ со специально разработанным промптом. Промпт содержал подробную инструкцию: что смотреть, как группировать, какие разделы заполнять. На выходе нейросеть выдавала структурированный документ — мы назвали его Опись сайта — по единому для всех шаблону.

Вот что входит в Опись:

Раздел 0. Общие данные — название компании, город, профиль деятельности, адрес сайта, дата сбора.
Раздел 1. Все страницы сайта — полный список всех страниц.
Раздел 2. Шапка сайта — какие ссылки и семантические блоки используется в шапке.
Раздел 3. Футер сайта — та же информация для подвала.
Раздел 4. Главная страница — все ссылки с главной, смысловые блоки, визуальные элементы.
Раздел 5. Функциональность — все формы обратной связи, онлайн-заказ, корзина, интерактивная карта и другие функции, которые исполняет сайт.
Раздел 6. Товары и цены — есть ли описания блюд (товаров и услуг), указаны ли цены и их точность и актуальность.
Раздел 7. Внешние ссылки — социальные сети, ссылки на внешние ресурсы.
Раздел 8. Обратная связь — телефоны, email, мессенджеры, формы обратной связи, отзывы и голосования и другие способы обратной с пользователями сайта.
Раздел 9. Юридическая информация — ИНН/ОГРН владельца сайта, политика конфиденциальности, соглашение о персональной информации, лицезии, оферты и прочее юридическое.
Раздел 10. SEO-данные — ключевые слова, метатеги, структура текстов, URL, перелинковка.

Важное уточнение: описи — наш внутренний рабочий инструмент. Мы их не публикуем и никому не показываем.

Как мы анализировали данные

Когда 50 описей были готовы, началась математика (статистика). Мы перестали быть исследователями и превратились в счетоводов. Задача была простой и одновременно сложной: подсчитать, сколько раз встречается каждая страница, каждый блок, каждая функция, каждое ключевое слово.

Простыми словами: мы просто считали, что встречается часто, а что — редко. И оказалось, что реальность сильно отличается от стереотипов.

Технические детали: для каждого элемента мы фиксировали частотность. Например, страница «Контакты» оказалась у всех 50 сайтов — 100% попадание. Страница «Меню» — у 37. А вот страница с подробным описанием отдельного блюда — только у 7. Это уже пища для размышлений.

Но самое главное, после подсчета — мы работали не со всей массой данных, а только с лидерами. Единичные случаи нас не интересуют. Если какой-то элемент встретился один-два раза — это случайность, а не закономерность. Мы выделяли ТОП — самые частотные позиции — и в дальнейшем оперировали только ими.

Примеры того, как это выглядело:

В шапке сайта мы выделили ТОП-9 ссылок и ТОП-6 блоков.
На главной странице — ТОП-11 ссылок, ТОП-7 смысловых блоков, ТОП-4 визуальных блока.
В футере — ТОП-8 ссылок и ТОП-7 блоков.
В функциональности — ТОП-4 функции.

Этот подход — работа только с лидерами, только с тем, что встречается у многих — позволил нам отсечь шум и увидеть реальную картину. Не «нам кажется», не «дизайнер так захотел», а объективные данные «как у большинства», основанные на анализе лучших.

Что дальше

Вся эта методология — не самоцель. Она нужна, чтобы ответить на главные вопросы: каким должен быть идеальный сайт кафе? Какие страницы обязательны, а без каких можно обойтись? Что реально работает в SEO, а что — пустая трата времени?

Ответы на эти вопросы — в нашем следующем материале: «Исследование: как устроен идеальный сайт кафе».

Мы покажем:

ТОП обязательных страниц — их оказалось всего три.
Что на самом деле должно быть в шапке и футере.
Какие функции нужны, а какие — лишние.
Как обстоят дела с ключевыми словами, метатегами, URL и перелинковкой у лидеров.

Подписывайтесь, чтобы не пропустить. В следующей статье будет отчет о реальном применении методики Prodactor.

Открытые данные и приглашение

Мы не прячем свои исследования. Если вы предприниматель, маркетолог или веб-разработчик — берите нашу методологию, проводите свои анализы. Проверяйте свои гипотезы, смотрите, как устроены конкуренты в вашей нише.

Если хотите, чтобы мы исследовали вашу нишу — автосервисы, салоны красоты, клининг, стоматологии — пишите, обсудим. Кафе было только первым примером. Мы открыты к сотрудничеству.

P.S. Для самых внимательных: да, во второй статье мы раскроем все те удивительные открытия, которые делали по ходу этого исследования. Про то, что хлебные крошки есть только у 30% лидеров, про то, что онлайн-консультанты почти никто не ставит, и про то, что герой-блок с красивой картинкой — совсем не обязателен. Будет интересно.

Фирменная методика Prodactor: как мы исследуем нишевые сайты

Зачем мы это делаем

Как мы отбирали сайты

Как мы сохраняли сайты

Как мы обрабатывали сайты

Как мы анализировали данные

Что дальше

Открытые данные и приглашение

Комментарии

Добавить комментарий Отменить ответ

Больше записей

Исследование: как устроен идеальный сайт кафе

Фирменная методика Prodactor: как мы исследуем нишевые сайты