DBF разбит на регионы, а XML там все в одном файле(7+ гиг несжатый). Я делал загрузку из DBF потому что так проще.
data.nalog.ru/Public/Downloads/20190919/fias_dbf.rar
В DBF каждая таблица ADDROBJ на один регион весит 50 мег, с данными домов - в 4 раза больше, хотя по сути там большинство это архивные данные.
Я вообще не уверен что excel способен такое прожевать. Лучше какой нибудь движок баз даннных с индексированием.
from dbfread import DBF
table = DBF("ADDROB77.DBF",encoding="cp866")
for row in table:
for i,coll in enumerate(table.field_names):
print("%d %s = %s"%(i,coll,row[coll]))
break#только первая строка для теста
Ну и поочереди записываешь в эксель файл строчки, можно еще прочитать коды состояний из других таблиц DBF