Ваша задача разделяется на следующие:
- Создание программы для извлечения лиц из заданного изображения. Если я верно понял, наработки для распознавания у вас уже есть, что уже очень хорошо. Можно оставить на том же языке. В случае необходимости, критичные для времени выполнения задачи можно (на/пере)писать на языке Go, с помощью средств которого можно распараллелить процесс обработки и таким образом ускорить работу со стороны сервера.
- Поскольку распознавание является ресурсоёмкой задачей, в особенности если требуется её выполнить на многих изображениях, то критичным параметром является необходимость распознавания лиц интерактивно (сразу посли загрузки пользователем альбома изображений, допустим). Если нет такой необходимости (насколько понял из описания) и можно выполнить в оффлайне (спустя некоторое время или даже заранее), то задача упростится - тут всякие background job scheduler в помощь.
- Со стороны сервера можно разделить операции на микросервисы, оформив в виде API серверов. Всё зависит от того какими технологиями вы владеете. Если знаете Python, то фреймворки облегчат ваш труд.
- Со стороны фронтенда возможно потребуются drag&drop мышью. Посоветуйтесь с экспертом в UX. Возможно придётся хорошенько поработать с JavaScript'ом. Выберите любой подходящий CSS фреймворк, ну или сами всё руками, если круты...
Добавлено позже
И если вы не имеете опыта в веб-разработке, то стоит поручить это дело другим людям.
Языки C/C++ в качестве серверного языка использовать не стоит. С Пайтоном будет проще и быстрее.
Вот как работает ваша демка:
face-detect.exe можно/нужно писать на языках Go/C/C++.