Чтение Excel файлов. Какой выбрать язык программирования?
Есть задача: читать файлы xls и xlsx (из под Excel 2003, 2007, 2010), а еще это могут быть кем то сгенерированные excel-файлы, которые даже сам Excel открывает ругаясь на неверный формат.
Сейчас написана читалка на php используя PHPExcel, но обнаружили некоторое количество файлов которые он не может кушать. Ну и плюс эта библиотека крайне медленная и прожорливая до памяти.
Отсюда вопрос, хотим все это дело отрефакторить и думаем написать на другом языке программирования, и вот тут не знаем как же нам выбрать язык (чтобы найти программиста) если мы сами знаем только php.
А то перебирать все языки и под каждый искать программиста, писать решение, а потом сравнивать скорость и возможности как-то накладно.
Знаем что есть либы под Python и под C#, может есть еще какие решения?
UPDATE 22.04.2016
Нашли программиста, который написал скрипт на перле, скорость поражает, а еще поражает всеядность, то что не мог прочитать PHPExcel этот читает на раз два.
Мне кажется правильнее будет не язык выбирать а разработчика. На любой фриланс бирже пишете свои требования к программе по функциональности и скорости работы, к обязательным условиям приписываете обработку вот тех файлов которые существующее решение не ест и смотрите на результат проверяя и на нормальных файлах и на несъедобных.
Ну тоже как вариант имеет место быть, спасибо. Просто может кто-то уже задавался такой же проблемой и сразу сможет сказать "дак вот же на чем писать надо, сам кучу перепробовал пока не нашел"
100500 различных версий формата файла - это не проблема языка программирования и библиотеки, это проблема только самого Excel, и не более. Надо заставить его самого решать свои проблемы - написать скрипт, который заставляет Excel открывать свои поделки и экспортировать их содержимое в человеческий формат. После чего можно уже нормально программно работать с данными в удобном формате удобными инструментами без перерасхода памяти. В качестве формата данных можно взять CSV, например, хотя выбор вариантов огромный.
Я использую PHPExcel никаких проблем нету (читает все форматы и не только excell). 1к записей залетает в базу с обработкой менее секунды.
Куча возможностей, и цвет поменять, и объединять ячейки, все что нужно там есть.
Денис Борисов, правильно Вам ответил. Чётче сформулируйте требования и выбирайте разработчиков.
А язык программирования определится из Ваших требований.