Я человек крайне далекий до компьютерных наук. Но столкнулся с необходимостью построения алгоритма, способного собирать статистический материал.
Вкратце ситуация такова: есть сайт Алибаба, есть представленные на нем компании, у компаний есть company_profile, в котором указана локация.
Стоит задача собрать насколько возможно полную базу данных и установить число компаний, приходящихся на каждую конкретную провинцию Китая. В дальнейшем планируется обновлять статистику по мере изменения обстановки на рынке е-коммерции.
Насколько решаема эта задача в принципе?