@PavelPav
Новичек веб-дизайна

Как сгруппировать слова по повторениям?

Есть много ячеек в одном столбце содержащих 2-4 слова, где одно из слов повторяется либо в полном вхождении, либо с другим окончанием.
Например:
пакет маленький
пакет средний купить
купить пакеты дешего
пакеты средние оптом

Таких строк очень много, можно перебирать с сортировкой указывая на повторения без окончаний вручную, но мне кажется это решается по другому. Можно ли сделать так, чтобы ячейки сгруппировались если в них есть хотя бы 2 одинаковых слова с неточным вхождением(чтобы учитывались слова с разным окончанием)?
upd. Дополнил пример. Касательно примера, из 4 ячеек должны сгруппироваться 2 и 4, потому что у них есть 2 вхождения с разным окончанием - "пакет" и "средни".
  • Вопрос задан
  • 81 просмотр
Пригласить эксперта
Ответы на вопрос 2
@shmaroder
https://creditpower.ru
На vba скрипт писать. Иначе никак.
Ответ написан
Комментировать
BasiC2k
@BasiC2k
.NET developer (open to job offers)
Задачу можно разбить на этапы:
1. Извлечение всех уникальных слов, составление из них списка;
2. Поиск в основном списке определённого слова (если содержит ..., то ...);
3. Отнимаем у слова букву, повторяем поиск в основном списке.
И так, пока не кончатся буквы и слова. Теоретически в п.3 можно делать проверку по орфографическому словарю, но это оправдано при частом выполнении данной задачи.

И лучше всего это делать не на VBA, а на другом ЯП + база данных, в несколько потоков.
Иначе это будет ооочень медленно.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы