Приветствую! Столкнулся с такой проблемой: передо мной стоит задача нечеткой кластеризации неких пользовательских запросов на основе схожести людей их задававших. В моих данных каждому запросу в однозначное соответствие поставлен массив людей, которые обращались в систему с таким запросом. Для лучшей иллюстрации приведу пример (
xls) . В файле каждому запросу Query в соответствие поставлен массив размерностью 25, но на практике размерность может различаться, все зависит от того сколько человек обращались с таким запросом. Необходимо произвести нечеткую кластеризацию на основе степени похожести массивов. Мой вопрос в том какой алгоритм кластеризации лучше всего использовать для этой задачи, возможно в составе уже существующих библиотек Data Mining'a (на C# или Python), а также с чего стоит начать, например, каким образом рассчитать расстояние между объектами.