Стемминг текста online

Выделение основы слова стеммером Портера. Оценка частоты употребления слов в тексте. Длина строки в символах.

Исходный текст

Показатели статистики текста:

  • Количество символов с пробелами и без пробелов.
  • Количество слов и предложений.
  • Количество вхождений заданного фрагмента текста.
  • Оценка частоты вхождений слов в текст на основе стемминга.

Функция поиска и подсчёта фрагмента текста поддерживает простейщие регулярные выражения (.?*+\n\s и пр).

Стеммер Портера. Оценка частоты вхождения слов

Алгоритм стеммера Портера позволяет выделять основы слов с помощью удаления характерных окончаний и суффиксов без применения словарей. Далее можно составить статистику вхождения слов в текст с частичным учётом словоформ и морфологии.

Данный инструмент стемминга позволяет оценить частоту употребления различных слов в своих текстах и текстах ваших конкурентов.

Из-за особенностей работы стеммер Пртера нередко допускает ошибки в определении основы слова, но в тоже время его достоинствами является быстрота работы и малая требовательность к ресурсам вычислительной машины.

Длина текста для SEO продвижения сайта норма?

Обычно в ТЗ копирайтерам указывают число символов без пробелов.

Длина текста на странице сайта может начинаться от 0 букв. Например, в ряде случаев (неконкурентная тематика, редкий материал) отлично ранжируются просто фото или калькуляторы.

В некоторых источниках указывается цифра в 500 символов на каждое ключевое слово. Но бывают варианты, когда следует просто написать текста больше, чем у ваших конкурентов :-).

Из своего личного опыта могу сказать, что текста на странице должно быть ровно столько, чтобы полностью решить проблему (ответить на вопрос) пользователя.