Недостаточно компетентен, чтобы ответить на 1 часть вопроса.
По второй части есть комментарий. Как я понимаю, сейчас вы работаете с mjpeg over http (судя по формату обращения). В современных камерах работа с mjpeg - стремящаяся к нолю величина. Большинство камер работают через rtsp-потоки, которые можно разбирать на кадры в ffmpeg и уже потом скармливать opencv (но это уже вне моей компетенции, теоретические размышления) Касаемо вопроса подбора формата rtsp-запроса (или mjpeg-запроса) - или индивидуально интегрировать запросы каждого производителя, или разобраться с получением его из профиля ONVIF (вас должен интересовать profile S и T)