Сделал решение с XmlReader, а внутри уже simplexml. Проблема в том что я все это пытаюсь импортировать в битрикс, и при загрузке нескольких картинок к каждому объекту получаю через минуту где то 504 ошибку от апача. Без файлов загружается быстро. Суть в том что мне с файлами надо загрузить. Файлы указаны как ссылки в объекте. Наверно придется загружать все объекты в строки новой таблицы в бд. А потом уже из таблицы читать и писать в инфоблок.
LINKeR UA: да текст состоит из нескольких абзацев разделенных по сути тегом может даже если и разбивались абзацы, но просто слова отрезались с учетом знаков препинания.