Думаю, group by склеивает ваши 12 результатов в 5 молча (как MySQL когда-то), а facet показывает результаты без группировки. Что возвращает поиск без группировки. У FACET есть подвыражение BY {expr}, можно попробовать с ним поэкспериментировать.
Не уверен, но мне кажется что в размерности 8-1-3-3 есть какой-то физический смысл, а не просто тасование байтов в потоке массивов картинок.
Ну и вроде бы reshape другие аргументы принимает: np.reshape(images, (8, 1, 3, 3))
Нет, строки, подобные определению моделей, урлов, class-based views и настроек Django-админки, покрывать тестами не стоит:
это неэффективное использование рабочего времени
вероятность в таких местах совершить ошибку, которую отловят тесты но не отловит человек при первом же использовании - минимальна
наконец, смысл таких тестов будет заключаться в проверке того, что вы написали тот текст который написали, что ни разу не приблизит вас к "коду без багов"
Вырезать надо сразу в распакованный вариант, отдельно это делать не надо.
Нужные дорожки можно выбирать с помощью -map, хоть русскую хоть английскую. Точно не знаю, поддерживает ли avi-контейнер несколько аудио-видео дорожек, может в этом проблема - можно попробовать распаковать в mkv.
И да, после монтажа - сжимать.
Чтобы вырезать четко, нужно декодировать исходный поток. Сохранить его можно будет только в сыром виде (3ГБ - это еще что...) или в перекодированном виде. Склеить потом вместе можно будет уже без перекодирования.
5 rows in set, 1 warning