Они берут поисковые запросы и документы, которые поиск находит по этим запросам, и оценивают, насколько хорошо найденный документ отвечает на заданный запрос. Оцениваются пары запрос-URL, при этом выставляются оценки: «витальный», «важный», «релевантный +», «релевантный» или «нерелевантный». Каждой из оценок соответствует некая вероятность того, что человек найдет на этом сайте то, что ему нужно.
Оценка происходит на основе инструкции асессора. Из запросов и хороших ответов составляется обучающая выборка. Она должна содержать самые разные запросы, причем в тех же пропорциях, в которых их задают пользователи. На обучающей выборке поисковая система устанавливает зависимость между страницами, которые асессоры посчитали релевантными запросам, и свойствами этих страниц. После этого она может подобрать оптимальную формулу ранжирования, которая показывает релевантные запросу сайты среди первых результатов поиска.
Чтобы измерить качество поиска, мы пропускаем случайную выборку запросов через асессоров, которые оценивают пары запрос-URL, выставляя им оценки: «витальный», «важный», «релевантный» или «нерелевантный». Каждой из оценок соответствует некая вероятность того, что человек найдет на этом сайте то, что ему нужно.
Формула ранжирования строится на различных комбинациях нескольких сотен факторов.
количество ссылок на сайт в интернете,
количество ссылок на страницу (ПейджРанк страницы в Гугле, ВИЦ в Яндексе),
Трастранк.
ИКС
присутствие в тексте страницы слов запроса, их количество и расположение (тестовая релевантность),
наличие в анкорах ссылок слов запроса (ссылочное ранжирование).
геозависимость и негеозависимость запроса.
- кликовые факторы,
- поведение пользователей на странице выдачи,
- посещаемость сайта,
- поведение пользователей на сайте.
Далее поисковая машина сравнивает сайты по этим факторам и определяет максимально релевантные ресурсы. Это и называется формулой ранжирования Яндекса, которая подбирается при помощи Матрикснета – метода машинного обучения.
Возраст сайта
При ранжировании Яндекс учитывает время существования страниц сайта (именно сайта, а не домена). Почему возраст так важен? Чем старше сайт, тем больше о нем информации в базе данных поисковика, страницы таких сайтов быстрее индексируются, доверие к таким ресурсам естественно выше. О новых сайтах (менее 6 месяцев) Яндекс почти ничего не знает и отправляет их в «песочницу» наращивать свою авторитетность. Именно поэтому молодым сайтам так сложно попасть в ТОП выдачи, особенно по высокочастотным запросам.
Правильная привязка сайта к региону, наличие контактной информации
Примерно 30% поисковых запросов являются геозависимыми, иными словами, привязанными к определенному региону.
Принадлежность сайта к региону определяется по ряду признаков. В основном это контактная информация и телефон, указанные на сайте, а также такие косвенные признаки, как текст сайта, его IP-адрес и т.п. Для того, чтобы ваш сайт корректно индексировался по геозависмым запросам, необходимо сделать его привязку к региону в «Вебмастере» Яндекса и указать на сайте правильную контактную информацию.
Оригинальный контент, релевантный целевым поисковым запросам
Поисковая машина так же учитывает контент сайта, его качество и уникальность. Если на сайте размещен оригинальный и интересный тематический контент, то это позволит получить органический трафик по низкочастотным запросам без всякого дополнительного продвижения. За копипасть велика вероятность попадания под фильтр Яндекса, так же под фильтр могут попасть молодые сайты, использующие чужой контент после небольшого рерайта.
Очень негативно Яндекс относится к переоптимизированным текстам, поэтому не стоит злоупотреблять количеством вхождений ключевых слов. Предпочтительная плотность ключевиков должна составлять от 1% до 3-4%. Слишком длинные тексты также не приветствуются, контент в первую очередь создается для посетителей сайта, а значит, он должен быть легким в восприятии и соответствовать тематике ресурса.
Структурирование информации на сайте