Сжатие JSON

Question

sdevalex @sdevalex

Сжатие JSON

Есть ли готовые библиотеки, которые убирают из коллекции одинаковых объектов ключи и записывают их отдельно? (в виде pack, unpack функций, а может быть и ещё чего-то)

Т.е.

[{ "data1": 1, "data2": 2, "data3": 3 },
 { "data1": 1, "data2": 2, "data3": 3 },
 { "data1": 1, "data2": 2, "data3": 3 }, ...]

В

{
   data: [[1, 2, 3], [1, 2, 3]. [1, 2, 3], ...],
   keys: ['data1', 'data2', 'data3']
}

Или это экономия на спичках?

Вопрос задан более трёх лет назад
9642 просмотра

4 комментария

Подписаться 9 Оценить 4 комментария

sdevalex @sdevalex Автор вопроса

Решение найдено.
github.com/WebReflection/JSONH

Написано более трёх лет назад
sdevalex @sdevalex Автор вопроса

JSON сжимается на 44%, если считать от изначального размера. В количестве символов:
(3639 — 2031) / 3639 = 0.44

Написано более трёх лет назад
sdevalex @sdevalex Автор вопроса
Жертвы минимальны:

Application.data.servers.reset(#{collection.to_json.html_safe});

Заменил на:

Application.data.servers.reset(JSONH.unpack(#{JSONH.dump(collection.as_json).html_safe}));

Для AJAX загрузки нужно будет… пока не нужно…
В Backbone.Collection переопределить метод parse:

class @Application.Collection extends Backbone.Model parse: (respoce) -> JSONH.unpack(responce)

И добавить упаковку при рендере JSON (тоже в одном месте для всех контроллеров).
Написано более трёх лет назад
sdevalex @sdevalex Автор вопроса

3.5кб — тестовые данные. Планируется на 1-2 порядка больше.

Написано более трёх лет назад

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 4

2 комментария

1 комментарий

sdevalex @sdevalex Автор вопроса
Rails делает из коллекции моделей такой JSON…

javascript: Application.data.servers.reset(#{collection.to_json.html_safe});

Application.data.servers — экземпляр Backbone.Collection
Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+1 ещё

Простой
Неправильно работает crypto.subtle.deriveKey в Firefox, баг или мой косяк?
- 1 подписчик
- 16 окт.
- 77 просмотров
0

ответов
JavaScript

Простой
Как подгружать xml с перерисовкой таблицы?
- 3 подписчика
- 14 окт.
- 132 просмотра
0

ответов
JavaScript

+2 ещё

Простой
Как решить задачку из контеста?
- 1 подписчик
- 13 окт.
- 222 просмотра
1

ответ
JavaScript

+1 ещё

Простой
Есть ли js-библиотека для офлайн-распознавания русской речи?
- 1 подписчик
- 12 окт.
- 156 просмотров
2

ответа
JavaScript

Простой
Почему не работает в консоли setTimeout?
- 1 подписчик
- 11 окт.
- 309 просмотров
1

ответ
JavaScript

Простой
Как прочитать ответ сервера после отправки формы?
- 2 подписчика
- 27 сент.
- 284 просмотра
1

ответ
JavaScript

+2 ещё

Простой
Как менять картинки у карточки в списке товаров?
- 4 подписчика
- 22 сент.
- 332 просмотра
1

ответ
JavaScript

Простой
Где найти исходники стандартной библиотеки JavaScript?
- 1 подписчик
- 21 сент.
- 320 просмотров
2

ответа
JavaScript

+2 ещё

Простой
Где найти такой слайдер?
- 1 подписчик
- 20 сент.
- 243 просмотра
1

ответ
JavaScript

+2 ещё

Простой
На сколько практично разделять логику загрузки данных?
- 4 подписчика
- 16 сент.
- 1209 просмотров
2

ответа
Показать ещё Загружается…

Верстальщик / фронтендер для браузерного расширения

DevTeam.Space

от 1 000 до 2 000 $

React разработчик

ITK academy • Нижний Новгород

от 80 000 до 120 000 ₽

React Developer

ITK academy • Воронеж

от 50 000 до 90 000 ₽

Решение найдено.
github.com/WebReflection/JSONH
JSON сжимается на 44%, если считать от изначального размера. В количестве символов:
(3639 — 2031) / 3639 = 0.44
Жертвы минимальны:

Application.data.servers.reset(#{collection.to_json.html_safe});

Заменил на:

Application.data.servers.reset(JSONH.unpack(#{JSONH.dump(collection.as_json).html_safe}));

Для AJAX загрузки нужно будет… пока не нужно…
В Backbone.Collection переопределить метод parse:

class @Application.Collection extends Backbone.Model parse: (respoce) -> JSONH.unpack(responce)

И добавить упаковку при рендере JSON (тоже в одном месте для всех контроллеров).
3.5кб — тестовые данные. Планируется на 1-2 порядка больше.

Answer 1 · 2012-10-10 09:38:19

Aleks @aleks_raiden

я думаю вы говорите про это: www.cliws.com/e/06pogA9VwXylo_GknPEeFA/

Ответ написан более трёх лет назад

2 комментария

Answer 2 · 2012-10-10 10:38:53

Если вы включите GZip сжатие при отдаче с сервера, то получите тоже самое, но прозрачно — архиватор построит частотное дерево для повторяющихся строк и заменит каждую из них несколькими битами.

Использование найденного вами подхода также ограничивает формат данных — все записи должны иметь одинаковую структуру.

Answer 3 · 2012-10-10 02:32:48

Вопервых это слишком специфичная оптимизация. Я допустим ни разу не встречал необходимости в подобном. Это все же не оптимизация даже, а способ агрегации данных.

Во вторых — да, это экономия на спичках. Даже если у вас этих данных мегабайт, то вы еще должны будете на клиенте/сервере данные обработать. Я бы лучше поэкономил процессорное время.

Answer 4 · 2012-10-10 03:01:06

Эта «оптимизация» больше зависит от того, как эти данные будут обрабатываться и использоваться.

Первый вариант имеет право на жизнь, поскольку он позволяет в потоке «кусками» передавать строки таблицы (структура данных и предложенная оптимизация больше похожа на описание таблицы), более того, позволяет пропускать значения конкретных «столбцов» считая что обработчик на автомате подставит туда `null` значения — данных то нет.

Второй вполне логичная оптимизация, однако потоком такую «таблицу» уже не передать, поскольку структура не предусматривает это by design и `null` значения уже не пропустить, иначе собьется порядок следования значений «стоблцов».

Итого: it depends. Необходимость этой «оптимизации» зависит не от экономии, а от способа обработки данных.

P.S. Если нужно получить более компактное представление JSON данных, при этом не пугает binary-формат и не хочется связываться с gzip — можно попробовать UBJSON — при полной совместимости размер обычно меньше процентов на 20-40, особенно при малом количестве ascii-строк и обилии unicode и числовых значений.

Answer 5 · 2012-10-10 06:39:07

Нет — это не экономия на спичках. Это гораздо хуже — совмещение ответственности по формату данных с ответственностью по сжатию данных. Это чревато массой не очевидных проблем, связанных с обработкой таких данных.

Если рассматривать данный подход как некую контентозависимую архивацию — то он имеет право на жизнь. Но его эффективность нужно сравнивать с другими решениями — для бинарных данных (контентонезависимыми) и текстовых. Сравнивать необходимо выигрышь при сжатии и скорость архивации и разархивации. Даже если вы и выиграете — конечно только в специфическом json — врятли в типичном. А чтобы еще и овчинка стоила выделки (то есть разница со стандартными архиваторами имела бизнес значение на проекте) — по моему нужно совсем какие то экзотические условия.

Но я могу и ошибаться — вы можете провести исследования и проверить.
Или используйте готовые решения для сжатия текстовых данных.
Для xml в отличие от json — есть сжатие специфическое для xml над сжатием текста — там с этим намного проще.

Сжатие JSON

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт