@FX-Mercury

Кто-нибудь поделиться структурой файлов Excel 2003 ( xls ), 2007 ( xlsx )?

Не могу найти док. по описанию структуры этих файлов. Нашел на английском - две проблемы:
так и ничего не понял, там только по xls.

Мне необходимо произвести экспорт данных, только экспорт. Размер файлов Excel слишком большой, если делать через OLE , то очень - очень долго идет процесс считывания. ДА и притом, что мне еще нужно удалить дубликаты.

Вот решил написать класс, который читает данные напрямую.
  • Вопрос задан
  • 2720 просмотров
Пригласить эксперта
Ответы на вопрос 4
@kalapanga
Вот здесь товарищ на PHP что-то из xlsx вытягивал: habrahabr.ru/post/140352 . Если Ваш файл максимально простая таблица, то наверное получится его прочитать. А вот если будут формулы, ссылки, оформление разное, то уже будет сложнее. По крайней мере цена на компоненты, которые это делают, не зря не маленькая.
Ответ написан
Комментировать
@vitvov
Файлы формата xlsx и все, которые заканчиваются на "x" - это реализация Open XML.
Структура таких файлов - это zip архив, только вместо *.zip, имеет расширение *xlsx, *docx и т.д.. Если вы измените расширение файла на .zip, то сможете посмотреть его структуру. В общем xlsx - это зазипованная папка, которая содержит папки, xml и другие файлы.
Open XML для Office
Open XML SDK
Ответ написан
Комментировать
@vilgeforce
Раздолбай и программист
Отправная точка по форматам "старого" офиса (doc, xls и много чего еще) - https://msdn.microsoft.com/ru-ru/library/dd942138.aspx
Дальше по конкретным форматам пара тысяч страниц.
Ответ написан
Комментировать
toxicdream
@toxicdream
Дружелюбный и доверчивый социопат
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы