Нужно отделить заголовки от тела. Для этого нужно найти вхождение двойного переноса первое и всё что дальше - тело.
Но перенос строки разный бывает - \r\n\r\n, \r\r и даже \n\n
Это что значит, нужно проверять вхождение сначала, а потом уже выцеплять?
На интересуемом меня сайте используется вроде \r\n\r\n.
Посмотрел несколько других сайтов - везде \r\n\r\n используется. Даже на linux.org.
Может это уже в качестве стандарта вводится уже \r\n\r\n для HTTP-протокола?
Ещё иногда в теле ответа есть какие-то символы сразу после \r\n\r\n и началом html-тегов. Не знаете, что они значат? Иногда бывают на некоторых сайтах, иногда нет.