Эффективный алгоритм сжатия массива float'ов и int'ов?

Question

Vitaliy @Ni55aN

Эффективный алгоритм сжатия массива float'ов и int'ов?

Попробовал LZS:
для случайного массива байтов получил сжатие почти в полтора раза. Например, 6000 байтов сжало в 4200
для массива точек в трехмерном пространстве в float32 при случайных позиций сжало в 1.7 раза, тем более при равномерном расположении точек (в виде регулярной сетки) показало сжатие более, чем в 6 раз.

Вопрос в следующем: есть более подходящие алгоритмы сжатия для float массива, и есть ли еще какие-то хаки для уменьшения размеров массива без существенных потерь данных?
Пока в мыслях такой вариант: float можно перевести в half, а так как чем больше число, тем меньше точность, и много точек находится рядом друг с другом, поэтому компенсировать это можно таким образом:
позиция каждой точки, начиная со второй, будет вычисляться как сумма наших half-float данных позиции с позицией предыдущей точки, которая уже преобразована в float

Также стоит добавить, что эти данные описывают 3D модель (вершинные и индексные буферы), пока посмотрю какие для 3D моделей есть решения, но не совсем уверен в том, что это подойдет, так как нужны такие массивы:
вершинный буфер - массив из 3*n float элементов, где n - количество вершин
индексный буфер - массив из 3*m int элементов (все значения меньше чем n), где m - количество треугольников
текстурный буфер - массив из 6*n float элементов

Еще главное то, что буферы небольшие (например, на вершинный приходится не более 30к float элементов, а чаще всего 10к, это примерно 40 кб)

Вопрос задан более трёх лет назад
915 просмотров

4 комментария

Подписаться 2 Оценить 4 комментария

d'Ivan @2ord

Это физические данные с датчиков (например, температура)? Показания идут по возрастанию/убыванию?

Написано более трёх лет назад
Vitaliy @Ni55aN Автор вопроса

Роман Мирр: это позиции в трехмерном пространстве. Данные могут быть в любом виде, но возможны случаи, когда две координаты равноудалены от соседних

Написано более трёх лет назад
d'Ivan @2ord

Виталий Столяров: возможно ли упорядочивание данных перед упаковкой?

Написано более трёх лет назад
Vitaliy @Ni55aN Автор вопроса

Роман Мирр: только по 3 элемента, каждую тройку элементов нельзя разделять друг от друга

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик

9 месяцев

Далее
ProductStar × РБК

Профессия: Инженер по информационной безопасности

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Программирование

+1 ещё

Простой
Проект для программирования?
- 2 подписчика
- 27 апр.
- 438 просмотров
8

ответов
Программирование

Простой
Олимпиадное программирование — с чего начать?
- 1 подписчик
- 18 апр.
- 345 просмотров
2

ответа
Программирование

Простой
Как управлять/хранить изображения для UI?
- 1 подписчик
- 10 апр.
- 171 просмотр
1

ответ
Алгоритмы

Простой
Как реализовать поиск слов в файлах?
- 2 подписчика
- 06 апр.
- 301 просмотр
3

ответа
Алгоритмы

Простой
Как распознавать полосу для робота на шахматной доске?
- 1 подписчик
- 19 мар.
- 187 просмотров
1

ответ
Программирование

+1 ещё

Простой
Стоит ли поступать в вуз на программу по математике, если в будущем хочешь иметь профессию, связанную с программированием?
- 4 подписчика
- 07 мар.
- 3296 просмотров
7

ответов
Алгоритмы

Простой
Какие данные берет функция для генерации случайного числа?
- 1 подписчик
- 18 февр.
- 225 просмотров
4

ответа
Программирование

Простой
Как можно оптимизировать загрузку данных?
- 1 подписчик
- 14 февр.
- 308 просмотров
1

ответ
C++

+1 ещё

Простой
Почему не решает задачу?
- 1 подписчик
- 05 февр.
- 393 просмотра
1

ответ
Программирование

Простой
Какие технологии/ИИ есть для клонирования русской речи?
- 12 подписчиков
- 02 дек. 2025
- 897 просмотров
1

ответ
Показать ещё Загружается…

Senior backend developer (Node. js)

DataLouna

от 5 000 до 7 500 $

Программист (backend Python, Django middle +) - работа очно в офисе в г. Москва

Главгосэкспертиза России • Москва

от 250 000 до 350 000 ₽

Программист Delphi/C++

Базис-Центр • Коломна

от 70 000 до 500 000 ₽

Это физические данные с датчиков (например, температура)? Показания идут по возрастанию/убыванию?
Роман Мирр: это позиции в трехмерном пространстве. Данные могут быть в любом виде, но возможны случаи, когда две координаты равноудалены от соседних
Виталий Столяров: возможно ли упорядочивание данных перед упаковкой?
Роман Мирр: только по 3 элемента, каждую тройку элементов нельзя разделять друг от друга

Answer 1 · 2017-05-02 14:05:53

Информация - это энтропия. Чем более полно Вы заложите в алгоритм сжатия мета-ифнормацию о входном потоке (статистику, центры масс, корреляции между соседними значениями, корреляции в пакетах и т.п.), тем лучше будет среднестатистический коэффициент сжатия на больших объемах. Расскажите о Ваших реальных данных ?

Answer 2 · 2017-05-02 14:14:59

Рекомендую послушать подкаст #44 автора проекта Akumuli (БД для хранения временных рядов, TSDB). Он рассказывает разные интересные вещи о хранении данных, в том числе о хранении массивов чисел.

Эффективный алгоритм сжатия массива float'ов и int'ов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт