Я кажется добрался до сути проблемы. Часть текста написана чистым utf8, часть написана при помощи numerical HTML encoding of the Unicode character.
Пример:
UTF8: Сбер
HTML:
Сбер
= Сбер
$doc->loadHTML(mb_convert_encoding($body, 'HTML-ENTITIES', 'UTF-8'));