Скажу такую вещь, но может поможет.
Как-то похожая задача была, мы использовали
Price Importer.
В качестве анализируемых давали свои же архивы и получали парсинг в эксель и другие форматы. Ну а дальше делали, что нам было нужно.
Платное решение, правда.
Не знаю, насколько это применимо к вашим задачам.