Хоть петабайты читайте, у вас все будет ограничиваться скорость доступа к жесткому диску, задержки которых больше, чем время вычислений в десятки раз. Вам же нужно просто считать кусок данных и записать их, что будет работать одинаково медленно что на c++ что на python. В любом случае, это не займет больше пары минут времени работы.
Собственно... считываете по кускам (если размер блока относительно невелик, то можно его брать за размер куска, если он большой, то стоит читать по кусочкам меньше размера блока) в память, и записываете в другом формате.