Дмитрий Для своей текущей задачи именно так и реализовал фильтрацияю лишних словосочетаний. Решил на Python. Код запостил пока тут smartking.ru/scripts/remove-duplicate-keys , если возникнет необходимость дорабатывать с учетом больших объемов данных, буду решать задачу по мере поступления. Пока же скрипт отработал быстро, при работе с достаточно большим файлом csv формата.
Написано
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.