любым методом результат будет неконсистентен.
всё равно вручную обрабатывать придется
можно искать вектора расстояний для различных названий товаров, те, что выше некоторого значения - скорее всего один товар (элементом вектора, как несложно догадаться, будет слово)