У одной конторы есть данные о поездках в её такси (обновляемые) за несколько лет.
Грубо говоря. начальная точка (GPS) -конечная точка (GPS) -маршрут (список GPS), возможно есть еще времена, какие-то служебные данные.
Вот можно было бы придумать, что из этих данных можно выжать, и т.о. как-то предложить свои услуги этой фирме (связи есть, сами управленцы не против использования этих данных). Т.е. вот вам фриланс-DataMining :) Идеи есть ?
Мне кажется суть DataMining-это как раз идеи, а вот реализация - это всего лишь дело техники.
Что это за статус такой - работник в иностранной компании? А если они нарушат трудовой кодекс своей страны, будете судится ?
Вас нанимают чтобы делать работу - так делайте как ИП.
Для каждой точки находим hashcode -- бинарное отображение координаты. Индексируем побайтно такой хешкод. Для искомой точки также строим hashcode.
В первом приближенини, чем ближе точки друг к другу тем более похожа у них левая часть хешкода. Т.о. вам нужно найти точки с минимальным отличием хемкода от заданного. По индексу это сделать проще (сложность O(log n)), чем перебором всех точек (сложность O(n)).
Задача: поднять ряд сервисов на таком ПК (в том числе и своей разработки) и раздавать их в сети. Бюджет пока не определен. Интересуют законченные решения.