Те фотографии, что человеку (!) кажутся похожими (например, 100 фотографий голубого неба+белого пляжа) на самом деле имеют некоторую общую информацию, но она находится в низкочастотной части спектра и ее очень и очень мало от общего объема информации. Я бы оценил в диапазоне от 0,5 до 2 %.
Всё остальное - это средне и высокочастотный спектр (расположение и кривизна береговой линии, камни, волны, облака и т.п.) - он занимает подавляющую часть информации при сжатии, и он будет для каждого фото разным.