Стоп-слова - как работают стоп-слова?

  1. Стоп-слова - как Google определяет?
  2. заключение

Во-первых, определение:

Стоп-слова - это слова, которые могут считаться не относящимися к набору результатов, отображаемых при поиске в поисковой системе. Примеры:, и, из, для, с, без, был.

Конечно, не имеет значения , зависит от выполненного поиска, потому что контекст поиска будет иметь все значение для каждого слова, используемого в исследовании.

Но почему я поднимаю эту проблему? Потому что многие люди, которые стремятся что-то сделать SEO в итоге они задаются вопросом о целесообразности правильного использования стоп-слов в своем контенте: заголовках, мета-описании, мета-ключевых словах и в контенте.

Прежде чем продолжить, важно понять, как поисковые системы работают со словами фразы: по заданной фразе поисковая система разбивает токены, причем каждый токен является подмножеством, образованным словами этой фразы. Наталия описала, как этот процесс работает, в статье в Главном агентстве как поисковые системы обрабатывают якорный текст , Пример был:

Предположим, что поисковая система находит ссылку с якорным текстом «Десять быстрых советов». Преобразование в токены:

  • "Десять быстрых советов"
  • «Десять»
  • «Советы»
  • «Быстрый»
  • "Быстрые советы"
  • "Десять советов"
  • "Десять постов"

Поняв, как фразы обрабатываются в поиске, мы переходим к обработке стоп-слов и как поисковые системы идентифицируют возможные стоп-слова.

Стоп-слова - как Google определяет?

Я нашел "старый" пост ( август 08 ) на сайте SEObytheSEA, сообщающем патент Google о том, как ваша поисковая система может работать для определения стоп-слов в соответствии с поиском, и работает следующим образом:

  • Для данного поиска он разбивается на токены, и наборы результатов собираются для токенов, содержащих возможные стоп-слова и без возможного стоп-слова; результаты, полученные в наборах, сравниваются, определяется их сходство и определяются возможные стоп-слова:

Для данного поиска он разбивается на токены, и наборы результатов собираются для токенов, содержащих возможные стоп-слова и без возможного стоп-слова;  результаты, полученные в наборах, сравниваются, определяется их сходство и определяются возможные стоп-слова:

Сложно? Давайте посмотрим пример: при выполнении поиска " другие «В Google набор первых 10 результатов состоит из:

  • 4, среди первых 7 результатов, по фильму "Другие"
  • 3 музыкальных результата
  • 3 Литературные результаты

С другой стороны, поиск " другой ", Возвращает в своем наборе первые 10 результатов:

  • 2 результатов для музыки
  • 2 видео результаты (например, Фабио де Мело и Кид Абельха)
  • Google Maps
  • 1 на фильм
  • еще 5 результатов

То есть определенная статья «os» в данном случае полностью соответствует набору представленных результатов. С другой стороны, сравнивая набор результатов поиска «жемчужины Интернета» (1) с набором «жемчужин Интернета» (2), можно заметить, что 7 из первых 10 результатов в (1) входят в число 10 первое в (2) - сходство 70%. Определенная статья «как» может рассматриваться как стоп-слово.

заключение

Фактически, патент Google имеет смысл и может фактически использоваться, или, возможно, очень близкая версия этого патента, выданная Google в прошлом году. Чтобы узнать, может ли термин считаться стоп-словом, действительно необходимо пройти тест и оценить результат.

Но имейте в виду, что правильное использование стоп-слов также влияет на решение пользователя о клике. Плохо написанные предложения могут увеличить неприятие пользователей, как я прокомментировал в своей статье оптимизация слов с ошибками ,

В примерах, приведенных в этой статье, я протестировал только первые 10 результатов по 2 токенам, Google может тестировать намного больше и установить степень сходства (70%, 30%, 90%), как это кажется более подходящим, но тесты в порядке убедительны. Что вы думаете? Какой у вас опыт со стоп-словами? Оставьте свое сообщение в комментариях, до следующего!