Есть много ячеек в одном столбце содержащих 2-4 слова, где одно из слов повторяется либо в полном вхождении, либо с другим окончанием.
Например:
пакет маленький
пакет средний купить
купить пакеты дешего
пакеты средние оптом
Таких строк очень много, можно перебирать с сортировкой указывая на повторения без окончаний вручную, но мне кажется это решается по другому. Можно ли сделать так, чтобы ячейки сгруппировались если в них есть хотя бы 2 одинаковых слова с неточным вхождением(чтобы учитывались слова с разным окончанием)?
upd. Дополнил пример. Касательно примера, из 4 ячеек должны сгруппироваться 2 и 4, потому что у них есть 2 вхождения с разным окончанием - "пакет" и "средни".
Задачу можно разбить на этапы:
1. Извлечение всех уникальных слов, составление из них списка;
2. Поиск в основном списке определённого слова (если содержит ..., то ...);
3. Отнимаем у слова букву, повторяем поиск в основном списке.
И так, пока не кончатся буквы и слова. Теоретически в п.3 можно делать проверку по орфографическому словарю, но это оправдано при частом выполнении данной задачи.
И лучше всего это делать не на VBA, а на другом ЯП + база данных, в несколько потоков.
Иначе это будет ооочень медленно.