Не могу найти док. по описанию структуры этих файлов. Нашел на английском - две проблемы:
так и ничего не понял, там только по xls.
Мне необходимо произвести экспорт данных, только экспорт. Размер файлов Excel слишком большой, если делать через OLE , то очень - очень долго идет процесс считывания. ДА и притом, что мне еще нужно удалить дубликаты.
Вот решил написать класс, который читает данные напрямую.
Если нужен только экспорт, то проще всего первым же номером экспортировать из Ёкселя в CSV и не морочить себе голову MS-овскими форматами (вылавливание их сюрпризов может растянуться на годы).
Вот здесь товарищ на PHP что-то из xlsx вытягивал: habrahabr.ru/post/140352 . Если Ваш файл максимально простая таблица, то наверное получится его прочитать. А вот если будут формулы, ссылки, оформление разное, то уже будет сложнее. По крайней мере цена на компоненты, которые это делают, не зря не маленькая.
Файлы формата xlsx и все, которые заканчиваются на "x" - это реализация Open XML.
Структура таких файлов - это zip архив, только вместо *.zip, имеет расширение *xlsx, *docx и т.д.. Если вы измените расширение файла на .zip, то сможете посмотреть его структуру. В общем xlsx - это зазипованная папка, которая содержит папки, xml и другие файлы. Open XML для Office Open XML SDK