Ответы пользователя по тегу Сжатие данных
  • Эффективный алгоритм сжатия массива float'ов и int'ов?

    Информация - это энтропия. Чем более полно Вы заложите в алгоритм сжатия мета-ифнормацию о входном потоке (статистику, центры масс, корреляции между соседними значениями, корреляции в пакетах и т.п.), тем лучше будет среднестатистический коэффициент сжатия на больших объемах. Расскажите о Ваших реальных данных ?
    Ответ написан
  • Какие виды алгоритмов сжатия способны сжимать даже плохо сжимаемые данные, но при этом не увеличивая конечный размер?

    1) Вы смешиваете алгоритмы сжатия, форматы данных и программы сжатия (архиваторы). Определитесь, что именно из этих 3 Вас интересует.

    2) Теоретически почти любая программа сжатия, определив, что данные после сжатия занимают место больше, чем в оригинале, заменит алгоритм на STORING.
    НО у Вас все равно появятся накладные расходы в виде заголовка этого формата. Более того, в теории этот заголовок не может быть меньше 1 бита, т.к. информацию о том, применялся ли алгоритм сжатия или нет, необходимо как-то донести до приемной (распаковывающей) стороны, если только Вы не будете использовать для этого out-of-band-data, например, изменять/сохранять исходное расширение файла в зависимости от использованного метода/формата.
    Ответ написан
    Комментировать
  • Задачки на "дробление чисел" для бенчмарков?

    Бенчмарк без понимания для чего будет использовать данное hardware конечный пользователь - немного бессмысленно. Может быть, имеет смысл сначала провести анализ, чем будет заниматься среднестатистический пользователь 80% времени, и именно из этого сделать бенчмарк ?
    Ответ написан
    Комментировать
  • Можно ли использовать такой способ сжатия фотографий?

    Те фотографии, что человеку (!) кажутся похожими (например, 100 фотографий голубого неба+белого пляжа) на самом деле имеют некоторую общую информацию, но она находится в низкочастотной части спектра и ее очень и очень мало от общего объема информации. Я бы оценил в диапазоне от 0,5 до 2 %.

    Всё остальное - это средне и высокочастотный спектр (расположение и кривизна береговой линии, камни, волны, облака и т.п.) - он занимает подавляющую часть информации при сжатии, и он будет для каждого фото разным.
    Ответ написан