Инструмент TF-IDF: вдохновение по ключевым словам для семантического SEO

  1. TL; DR
  2. WTF, TF-IDF?
  3. Срок Частота
  4. Частота обратных документов
  5. Колибри, RankBrain, TF-IDF и семантический поиск
  6. Как TF-IDF работает в WebSite Auditor

Автор: Олег Барысевич , соучредитель и директор по маркетингу SEO PowerSuite

18 апреля 2017 г.

TL; DR

TF-IDF (сокращение от «частота-обратная частота документа») уже давно используется Google для определения релевантности страниц в индексе для данного запроса. Затем был Колибри, а затем Ранкрейн. Инструмент TF-IDF, выпущенный сегодня в WebSite Auditor Это попытка объединить эти три понятия, чтобы дать вам рекомендации по оптимизации на основе данных в эпоху семантического поиска. Этот новый инструмент использует алгоритм TF-IDF, чтобы помочь вам оптимизировать ваши страницы для актуальности, чтобы они занимали более высокое место в результатах поиска.

Инструмент TF-IDF полностью доступен в бесплатной версии WebSite Auditor; чтобы начать использовать его, просто загрузите WebSite Auditor (или перезапустите приложение, если оно уже установлено - оно автоматически обновится при запуске) и перейдите прямо к Content Analysis> TF-IDF .

Вы также можете прочитать краткое описание TF-IDF и его место в алгоритме Google, то, как инструмент TF-IDF работает в WebSite Auditor, и как вы можете использовать его для оптимизации своих страниц.

WTF, TF-IDF?

С самого первого дня поисковые системы пытаются обрабатывать и интерпретировать контент, как это делают люди. Оглядываясь назад, люди (точнее, оптимизаторы, определенное подмножество людей) пытались сделать обратное - выяснить, как поисковые системы интерпретируют текст, чтобы взломать секретный код ранжирования в верхней части результатов поиска. Вот как SEO разработали такие метрики, как плотность ключевых слов - простой, легко вычисляемый показатель, который можно использовать при оптимизации на странице.

Но Google никогда не использовал плотность ключевых слов из-за того, что он шумный и им легко манипулировать. Вместо этого Google давно пользуюсь TF-IDF в индексации и поиске информации; несколько из Google патенты Также подразумевается, что TF-IDF используется в рейтинге. Основная цель TF-IDF - выяснить важность данного ключевого слова для данной страницы .

Математически TF-IDF является продуктом того, как часто ключевое слово появляется на странице (TF) и как часто оно должно появляться на средней веб-странице, основываясь на большем наборе документов (IDF).

Поскольку TF-IDF сравнивает использование ключевого слова отдельной страницы с использованием большого количества документов, это довольно четкая оценка важности этого термина для страницы. Это уменьшает значимость неважных слов и фраз (подумайте о функциональных словах и вводных терминах) - потому что весь набор документов тоже их использует. Более редкие, значимые термины, напротив, имеют большее значение.

Срок Частота

Возможно, вы захотите думать о частоте терминов как о нормализованной версии плотности ключевых слов. Вот одна из формул, обычно используемых для ее вычисления:

Не позволяйте логарифмам оттолкнуть вас - благодаря журналам в TF меньше шума, чем в плотности ключевых слов. Скажем, если у вас есть страница длиной в 1000 слов, на которой ваше целевое ключевое слово появляется 10 раз, то плотность ключевых слов этого термина будет составлять 1%; его частота будет 4,32 / 9,97 = 0,43 (если вы используете базу 2 журналов).

Если вы отредактируете страницу так, чтобы ключевое слово показывалось в 2 раза больше (в 20 раз), тогда его исходная плотность будет в 2 раза больше - 2%. Но TF не поднимется так сильно; это будет 5,32 / 9,97 = 0,53 (опять же, с использованием базы 2).

Частота обратных документов

IDF измеряет отношение общего количества документов в корпусе к количеству документов, содержащих данное ключевое слово.

Как видите, если ключевое слово является общим словом, которое упоминается во многих документах, значение IDF будет крошечным; когда мы умножим TF на него, чтобы получить TF-IDF, он не сильно увеличится. Если, наоборот, термин встречается только в нескольких документах, его IDF будет существенным (и, следовательно, TF-IDF приведет к увеличению цифры).

Колибри, RankBrain, TF-IDF и семантический поиск

Hummingbird - это название алгоритма ранжирования, который Google начал использовать в 2013 году. Hummingbird использует контекст и намерение поисковика (в отличие от отдельных ключевых слов в запросе) для получения наилучших результатов. В соответствии с Википедия Hummingbird «способен понимать понятия и отношения между ключевыми словами» , и его цель «состоит в том, чтобы страницы, соответствующие значению, работали лучше, чем страницы, соответствующие всего нескольким словам» .

RankBrain (запущенный в октябре 2015 года) является частью алгоритма Google Hummingbird. Его цель аналогична цели Колибри, но мы понимаем, что механизм, который он использует, отличается. Google недавно сказал что RankBrain «участвует в каждом запросе» и влияет на фактическое ранжирование «вероятно, не в каждом запросе, а во многих запросах» .

В RankBrain есть две части: часть анализа запросов и часть ранжирования . В первом случае RankBrain пытается интерпретировать запросы (особенно редкие или совершенно новые запросы с длинным хвостом), связывая их с другими более распространенными запросами и концепциями, чтобы обеспечить лучшие результаты поиска в ответ. Что касается ранжирования, он анализирует страницы в своем индексе и ищет конкретные функции, которые делают их релевантными для запроса (я сейчас выясню, каковы эти функции). Эти страницы не обязательно будут содержать точные слова из запроса, но, тем не менее, актуальны.

Таким образом, как Hummingbird, так и RankBrain, кажется, сосредоточены на определенных не зависящих от ключевых слов особенностях веб-страниц, чтобы выяснить, является ли страница хорошим результатом поиска по запросу. Такие «функции» определяются путем анализа наиболее эффективных результатов поиска в соответствии с показателями удовлетворенности пользователей Google. Эти показатели могут включать рейтинг кликов в поисковой выдаче, количество подписчиков, время на странице и т. Д.

Столь эффективно, RankBrain может анализировать группу результатов поиска, которые имеют высокий рейтинг для похожих поисков и имеют хорошие сигналы удовлетворенности пользователей, и искать функции, которые разделяют эти страницы - другими словами, функции, которые делают их хорошими результатами поиска. Эти функции могут затем использоваться в качестве специфичных для ниши сигналов ранжирования для связанных запросов. Поскольку большая часть онлайн-контента является текстовой, такими функциями часто являются наличие определенных терминов и фраз на странице.

Позвольте привести пример. Если вы ищете «всеобъемлющее руководство по SEO» в Google, даже половина результатов, которые вы получите, не будет содержать этих точных слов. У RankBrain может быть лучший способ узнать, каковы лучшие результаты для этого запроса. Если посмотреть на их содержание, то обнаружится, что у этих лучших результатов есть несколько общих черт ...

На большинстве страниц с самым высоким рейтингом для "всеобъемлющего SEO-руководства" упоминаются такие термины, как "поисковые системы", "создание ссылок", "исследование ключевых слов" и т. Д. - термины, с которыми мы все согласны, должны присутствовать в руководстве по SEO, в котором называются Сам по себе всеобъемлющий. Так что это впечатляющий способ RankBrain реинжиниринга человеческого мозга.

Инструмент TF-IDF в WebSite Auditor делает нечто похожее: он анализирует самые популярные страницы для ваших целевых ключевых слов и ищет термины и фразы, которые используют многие из них. Это тематические термины и понятия, которые помогут вам повысить релевантность (и, следовательно, рейтинг) ваших страниц в эпоху семантического поиска.

Как TF-IDF работает в WebSite Auditor

Новый инструмент TF-IDF в WebSite Auditor позволяет вам находить термины, которые по своей сути связаны с вашими целевыми ключевыми словами или темами, судя по содержанию ваших наиболее эффективных конкурентов. Он использует тот же алгоритм TF-IDF, что и поисковые системы, только набор документов - это не Интернет, а ваши 10 лучших конкурентов.

Чтобы начать анализ, перейдите в Content Analysis> TF-IDF в WebSite Auditor , выберите страницу, которую вы собираетесь оптимизировать, и введите целевое ключевое слово. Пока вы в этом, вот что приложение делает за кулисами:

1. Перейдите к результатам поиска Google, чтобы выбрать 10 самых рейтинговых конкурентов по целевому ключевому слову.

2. анализирует содержание каждого из конкурентов;

3. Составляет полный список слов и фраз, которые участники используют в своем контенте;

4. Рассчитывает TF-IDF для использования каждого термина на каждой странице и среднего TF-IDF каждого термина среди 10 страниц;

5. Рассчитывает TF-IDF для использования тех же терминов на вашей странице;

6. Создает таблицу из этих ключевых слов и красивый график для вас, чтобы посмотреть.

Список терминов, которые вы видите, отсортирован по количеству страниц конкурентов, которые их используют - это гарантирует, что самые важные, релевантные термины появятся в верхней части. Столбец Рекомендации содержит рекомендации по использованию каждого термина, который отображается на страницах 5 или более конкурентов:

  • Добавьте, если вы не используете важный термин вообще;
  • Используйте больше, если TF-IDF термина на вашей странице ниже минимального значения конкурентов;
  • Используйте меньше, если термин TF-IDF выше наивысшего значения конкурентов.

Вы даже можете вносить изменения в свою страницу и реализовывать эти рекомендации прямо в WebSite Auditor, зайдя в Редактор контента , где вы можете редактировать контент в редакторе WYSIWYG или в HTML.

Попробуйте поиграть с инструментом TF-IDF самостоятельно в бесплатной версии WebSite Auditor - обещаю, вам предстоит не только несколько захватывающих открытий.

Загрузите WebSite Auditor, чтобы попробовать инструмент TF-IDF:

Если вы хотите проанализировать более 500 страниц, сохранить проекты и экспортировать данные из приложения, вы можете получить полную лицензию WebSite Auditor здесь ,

Последнее слово предостережения - пожалуйста, не принимайте буквально каждую рекомендацию на панели инструментов TF-IDF. Алгоритм делает все возможное, чтобы подобрать для вас лучшие условия и дать совет по использованию; но прежде чем вносить изменения в свою страницу, помните, что любой контент, который вы добавляете, должен иметь ценность для пользователя. Другими словами, не пытайтесь использовать это как способ заставить поисковые системы думать, что ваша страница - это то, чем она на самом деле не является; вместо этого используйте его в качестве алгоритмического вдохновения для ключевых идей и улучшения вашего контента.

Похожие

SEO
Добро пожаловать в этот блог, я Саддам Гозали, который немного объяснит SEO это?. Поисковая оптимизация, которая обычно сокращается SEO Это попытка сделать блог, который направлен на увеличение объема трафика через
Как
Der Roman Ungeduld des Herzens, der veröffentlicht wurde, ist der einzige adette Roman des österreichischen Авторы Стефан Цвейг. Постановка Саймона Макберни романа Стефана Цвейга фокусируется на том, что такое Унгедулд де Герценс (буквально «нетерпение сердца»). Это новое совместное совместное производство
корпоративный SEO
Корпоративное SEO - это контент сайта, который подготовлен для продуктов и услуг любого бизнеса. Чтобы найти компании, с которыми можно связаться по поводу продукта или услуги в Интернете, необходимо провести корпоративное исследование SEO. Корпоративное SEO может быть сделано для сектора или услуги. Те, кто хочет получить корпоративные услуги SEO, войдут в интернет и зайдут на один из сайтов на первой странице поисковой системы. Лучшее качество среди этих сайтов будет в верхних строчках
SEO Консалтинг
... инга в Inktomi - мы были Google, прежде чем Google был Google"> Я начал свою карьеру онлайн-маркетинга в Inktomi - мы были Google, прежде чем Google был Google. Я занимаюсь поисковой оптимизацией, разработкой веб-сайтов и маркетингом контента в течение многих лет. Вы можете прочитать больше о моих мыслях на SEO при продаже на C , Но поисковая оптимизация не проста. Это сложно и то, как вы к нему подходите, сильно варьируется от
NULLED SEO
Гораздо быстрее, лучше выглядит, более организованно SEnuke X был полностью переписан с нуля в совершенно новой технологии. Это позволило нам сделать то, что было технически невозможно с предыдущей версией SEnuke. Пользовательский интерфейс был полностью переработан, и теперь программное обеспечение основано на центральной базе данных, поэтому вам больше не нужно перемещать
Как облачный хостинг работает с SEO?
Будущее за облачными вычислениями, мы уже знаем, что все больше и больше крупных компаний начинают использовать облачный хостинг как часть своей инфраструктуры хостинга. Это влияние наблюдалось в крупномасштабном бизнесе, но печальная часть заключается в том, что оно не было задействовано глобально во всех секторах и разных масштабах отраслей. В большинстве масштабов облачный хостинг находится на начальной стадии, хотя сервис существует уже довольно давно. Неосведомленность о платформе и
SEO .BZH
Поисковые системы, такие как Google, используют множество критериев для оценки качества сайта в ответ на ввод выражения пользователем. Задача последних лет заключалась в том, чтобы сделать результаты более актуальными благодаря их персонализации на основе профиля пользователя. Боковой Интернет , обнаружение языка осуществляется, в том числе, с помощью используемого навигатора. Географическая персонализация осуществляется путем геолокации его IP-адреса.
Сассекс SEO
Мы быстро стали технологически ориентированным миром. Многие из нас не могут оставить свои смартфоны дома, потому что нам просто нужно проверить нашу электронную почту или посмотреть последние сообщения на нашей любимой социальной сети. Люди используют поисковые системы, чтобы находить информацию точно так же, как они привыкли зависеть от местных Желтых страниц. Из-за
SEO Доктор
... и ваш сайт начал классифицироваться по низким позициям или был дискредитирован Google, мы поможем вам определить причины этого и дадим вам рекомендации для вашего здорового и мудрого поведения, когда мы восстановим лидирующие позиции вашего сайта"> Если ваш сайт начал классифицироваться по низким позициям или был дискредитирован Google, мы поможем вам определить причины этого и дадим вам рекомендации для вашего здорового и мудрого поведения, когда мы восстановим лидирующие позиции вашего
Местное SEO
Возможно, ваш малый или средний бизнес не сможет конкурировать с более крупными брендами на национальном уровне, но вы можете доминировать на местном рынке, используя преимущества локальной поисковой оптимизации. Позвольте
SEO услуги
Webfrnz Technologies как признанная компания интернет-маркетинга предлагает вам индивидуальные услуги SEO, которые помогают вашему сайту достичь высокого рейтинга в поисковых системах. SEO это все о создании безошибочного сайта и позиционировании вашего сайта для поисковых систем. Мы гарантируем, что все основные поисковые системы, включая Google и Bing, правильно индексируют ваш сайт. Наши методы SEO помогают вам продавать

Комментарии

Он выполняет поиск по ключевым словам и если да, то как?
Он выполняет поиск по ключевым словам и если да, то как? Знает ли он разницу между техниками черной и белой шляп? Является ли его собственный сайт SEO-дружественным? Другими словами: вы должны задавать вопросы. Недостаток SEO текстов Существует граница между оптимизированным и чрезмерно оптимизированным. Самым простым способом написания SEO-текстов является заполнение ключевых слов : заполнение текста ключевыми словами.
Как поисковые системы находят правильные сайты по вашим ключевым словам?
Как поисковые системы находят правильные сайты по вашим ключевым словам? Поисковые системы, такие как Google, имеют сканер, который запускается на каждом веб-сайте, собирает информацию, которую можно найти в Интернете, и возвращает данные в формате 1 и 0. Это создает индекс, который сопоставляется при вводе ключевого слова, например «рецепт шоколадного торта». Теперь, когда вы понимаете «SEO» часть SEO, давайте расскажем вам больше о «O» части, которая является оптимизацией.
Итак, разве не было бы неплохо, если бы вы знали, как получить рейтинг своих видео на Youtube на первой странице по вашим ключевым словам в 2016 году?
Итак, разве не было бы неплохо, если бы вы знали, как получить рейтинг своих видео на Youtube на первой странице по вашим ключевым словам в 2016 году? Чтобы сделать это, вам нужно знать последние SEO-факторы ранжирования, которые определяют, какие видео и где ранжируются. Конечно, YouTube никогда не раскрывает точный алгоритм ранжирования видео, но благодаря некоторым методам проб и ошибок, большому количеству исследований и некоторой помощи от
Как работает поисковая оптимизация (SEO)?
Как работает поисковая оптимизация (SEO)? Большинство из тех, кто спрашивает о SEO, будут очарованы магической мантрой «уникальный контент», касающейся поисковой оптимизации. Что было бы очень просто, но поле гораздо глубже. Основой являются сайты, которые хорошо сделаны. Это означает, что это зависит от технической стороны вопроса. SEO также включает в себя правильно структурированный сайт. Таким образом, на практике заголовок должен быть помечен как заголовок в исходном коде
Мы все знаем, как важно настройка текстового содержимого с конкретные ключевые слова предназначен для целей SEO (поисковой оптимизации) на вашем сайте, но как насчет изображений?
Как работает поисковая оптимизация (SEO)? Большинство из тех, кто спрашивает о SEO, будут очарованы магической мантрой «уникальный контент», касающейся поисковой оптимизации. Что было бы очень просто, но поле гораздо глубже. Основой являются сайты, которые хорошо сделаны. Это означает, что это зависит от технической стороны вопроса. SEO также включает в себя правильно структурированный сайт. Таким образом, на практике заголовок должен быть помечен как заголовок в исходном коде
Как я могу собрать информацию или узнать, по каким ключевым словам мои конкуренты атакуют?
Как я могу собрать информацию или узнать, по каким ключевым словам мои конкуренты атакуют? Использование SemRush. Этот инструмент очень универсален; в рамках SEM он обслуживает как SEO, так и SEA, а также дает вам возможность собирать информацию о: Какие ключевые слова использует конкурс в ваших объявлениях? Какой трафик эти ключевые слова отправляют на ваш сайт? Как и сколько ваших объявлений Сколько ключевых слов
Как работает SEO?
Как работает SEO? SEO - это процесс получения большего количества трафика из результатов поиска в поисковых системах. Делая SEO, вы узнаете о том, как сделать маркетинг с помощью интернет-маркетинга. По сути, SEO - сделать ваш сайт лучше для поисковых систем. Хотя есть много поисковых систем, но люди делают больше поисков в Google, потому что это самая популярная поисковая система среди других поисковых систем. У Google есть много поисковых роботов, которые
Как работает SEO в целом?
Как работает SEO в целом? Итак, чтобы ответить на первый вопрос, вы должны сначала понять, как работают поисковые системы. Поисковые системы - это просто огромный компьютер, который хранит списки сайтов. Там нет порядка для них в любой форме или форме. Думайте об этом как о старой телефонной книге, но онлайн. Поисковые системы, такие как Google , Yahoo , а также Bing все пытаются
Почему Патель думает, что социальный является новым SEO, и как другие маркетологи интегрируют социальное в свою стратегию SEO?
Почему Патель думает, что социальный является новым SEO, и как другие маркетологи интегрируют социальное в свою стратегию SEO? Я углубился в исследование этой темы и определил 5 ключевых моментов, которые каждый маркетолог должен знать о том, как социальные медиа влияют на SEO в 2014 году (в 2015 году). Мое исследование также оставило меня с несколькими вопросами, которые я упоминаю всюду по почте; Я хотел бы услышать ваши мысли в комментариях ниже! 5 вещей, о которых
Что такое мета-бокс Yoast SEO и как он работает?
Что такое мета-бокс Yoast SEO и как он работает? Что вы можете сделать на панели инструментов Yoast SEO Затем в следующем разделе мы коснемся более сложных тем Yoast SEO. Использование Yoast SEO Setup Assistant После установки Yoast SEO вы можете получить доступ к панели инструментов Yoast SEO , просто нажав на новую вкладку SEO на панели инструментов WordPress. Если вы впервые используете этот плагин, вы увидите
Как видите, цены на услуги SEO довольно разные, когда их спрашивают, сколько стоит SEO?
Как видите, цены на услуги SEO довольно разные, когда их спрашивают, сколько стоит SEO? Это действительно зависит от того, что вы ищете, и цены, которую вы готовы заплатить за эти услуги. Что можно сделать, чтобы улучшить свой рейтинг и сколько это стоит? SEO Experts Inc с 2002 года занимает первое место в рейтинге специалистов по SEO в Google. Получите БЕСПЛАТНОЕ индивидуальное предложение и оформите предложение

WTF, TF-IDF?
Он выполняет поиск по ключевым словам и если да, то как?
Знает ли он разницу между техниками черной и белой шляп?
Является ли его собственный сайт SEO-дружественным?
Как поисковые системы находят правильные сайты по вашим ключевым словам?
Как поисковые системы находят правильные сайты по вашим ключевым словам?
Итак, разве не было бы неплохо, если бы вы знали, как получить рейтинг своих видео на Youtube на первой странице по вашим ключевым словам в 2016 году?
Итак, разве не было бы неплохо, если бы вы знали, как получить рейтинг своих видео на Youtube на первой странице по вашим ключевым словам в 2016 году?
Как работает поисковая оптимизация (SEO)?
Как работает поисковая оптимизация (SEO)?
О том, как смешивать свежевыжатые соки
Ни для кого не секрет, что стакан свежевыжатого овощного или фруктового сока, способен придать заряд энергии и бодрости, а также положительным образом отразиться на состоянии здоровья человека. При этом

Полный список кандидатов в президенты страны станет известен к концу января
9 января 2008, 15:53 Текст: editor На будущей неделе закончится срок приема документов для регистрации кандидатов в президенты. На принятие решения по документам у Центризбиркома будет десять дней. НОРИЛЬСК.

ЄДНІСТЬ : У Києві через високий рівень захворюваності на грип та ГРВІ закрили вже 75 шкіл
У Києві призупинено заняття у 75 школах (2127 класів), у яких рівень захворюваності на грип та ГРВІ перевищив 20%. Інформує  «Є!» , з посиланням на УНІАН. Про це наразі повідомив перший заступник

Список полезных заготовок из овощей и фруктов на зиму
Список полезных заготовок из овощей и фруктов на зиму Август и сентябрь — традиционно хлопотное время для многих хозяек, садоводов и дачников-любителей. В первую очередь необходимо собрать урожай или

Березовый сок можно ли использовать при сахарном диабете
Березовый сок при сахарном диабете — сахарный диабет: все о заболевании и методах лечения Березовый сок с давних времен славится своими целебными свойствами. Дело в том, что в весенний период береза

Свежевыжатые соки. (кому не лень читать)
Вы видели фильм о , которую исследовал японский ученый Имоту Масара? Уникальные опыты показали, что структурированная жидкость может творить чудеса и оздоравливать наши клетки, омолаживая организм

Купажирование и подслащивание соков
Некоторые соки иногда бывают пресными, слишком кислыми или недостаточно сладкими. Чтобы такие соки были полноценными по вкусовым и питательным качествам, к ним добавляют соки из того же вида сырья, но

Лечение рака по Бройсу и др
Лечение Рака по Бройсу. (Рудольф Бройс) «Совсем недавно китайские медики обнаружили, что у онкобольных количество микроэлементов в печени, в волосах и некоторых других органах резко снижено. Возможно,

С каким соком пить водку?
Ответ: С каким соком пить водку? ВИНОВАТ АНТИАЛКОГОЛЬНЫЙ ФЕРМЕНТ - Владимир Георгиевич, главный вопрос

Сок добрый
Министерство общего и профессионального образования Российской Федерации Санкт-Петербургский Государственный Технологический институт (Технический университет) Факультет Экономики и