Как реализовать инкрементное (дифференциальное) хранение строк?

Question

Николай Чуприк @choupa

Архитектор (обычный, который строит)

Веб-разработка

Как реализовать инкрементное (дифференциальное) хранение строк?

Есть web-приложение. Данные, которые редактирует пользователь, в фоновом режиме (по ajax) сохраняются на сервере в БД в виде большой (на несколько килобайт) строки JSON. Сохранение происходит при любом сколько угодно малом редактировании (onkeypress).

Меня смущают 2 вещи:

1. Качка на сервер полного набора данных при сохранении, а оно происходит при каждом "чихе" пользователя. Я конечно понимаю, что в век быстрого интернета это не проблема, тормоза в работе не наблюдаются, но моё программистское "я" сильно недовольно.

2. Но главное, хочется реализовать undo для пользователя, чтобы можно было откатывать редактирование данных в web-приложении. Хранить историю изменений в виде полного набора данных для каждого нажатия клавиши, очевидно не вариант.

Поэтому я задумался об инкрементном сохранении (и передаче) данных. Т.е. есть JSON-строка str1, есть строка str2 мало отличающаяся от str2. Требуется

а). находить разность строк diff, которую можно кратко записать;
б). восстанавливать str1 по str2 и diff, и наоборот.

Нужно что-то типа XOR для строк. Однако если переводить строки в битовое представление и делать XOR, то будет плохо, т.к. вставка символа в середину строки приводит к очень большой битовой разнице.

Кто может подсказать какие-то полезные идеи, ссылки или готовые реализации?

Вопрос задан более трёх лет назад
168 просмотров

9 комментариев

Подписаться 2 Простой 9 комментариев

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Академия Эдюсон

Веб-разработчик Базовый

9 месяцев

Далее
ProductStar × РБК

Профессия: Web-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Веб-разработка

+4 ещё

Простой
Как хранить публичный медиа-контент сайта?
- 1 подписчик
- 03 июл.
- 225 просмотров
3

ответа
Веб-разработка

Простой
В какой программе/сайте можно создать и выгрузить html сайт?
- 3 подписчика
- 21 июн.
- 871 просмотр
3

ответа
Веб-разработка

+2 ещё

Средний
Как избежать вездесущего agentic coding и остаться в IT?
- 8 подписчиков
- 01 июн.
- 3721 просмотр
12

ответов
Веб-разработка

+2 ещё

Средний
Как правильно хранить видео в Django?
- 2 подписчика
- 28 мая
- 463 просмотра
3

ответа
Веб-разработка

Простой
Какую панель для хостинга выбрать в моём случае?
- 2 подписчика
- 25 мая
- 512 просмотров
6

ответов
Веб-разработка

+1 ещё

Средний
Изоляция сетевого слоя (WebSockets/Fetch) в Web Worker для высоконагруженного UI: используют ли такой паттерн в реальном проде?
- 1 подписчик
- 24 мая
- 224 просмотра
4

ответа
Веб-разработка

+1 ещё

Средний
Safari помечает легитимный сайт как мошеннический. Google clean, Apple не отвечает. У кого был похожий опыт?
- 2 подписчика
- 22 мая
- 249 просмотров
2

ответа
Веб-разработка

+2 ещё

Сложный
Сайт висит при первом заходе на него. Как такое исправить?
- 3 подписчика
- 20 мая
- 1179 просмотров
4

ответа
Веб-разработка

Средний
Каков план обучения для веб разработки аналога foodsharing.de?
- 1 подписчик
- 19 мая
- 195 просмотров
1

ответ
Веб-разработка

+1 ещё

Простой
Где можно хранить данные пользователя для синхронизации?
- 1 подписчик
- 19 мая
- 340 просмотров
5

ответов
Показать ещё Загружается…

По функциональности похоже на редактирование документа в Google Docs?
сделать гит репу, разбивать джсон на строки по одному символу, коммитить каждый чих))
65536, ха-ха. Индусский метод, однако.
Роман Мирр, нет похоже. Чтобы не писать много слов, вот это приложение: termootkos.ru
вот такое нашел. ниче не знаю об этом, но по описанию что-то похожее https://www.php.net/manual/ru/function.xdiff-strin...
65536, О! Спасибо. То, что надо. Вот бы ещё на стороне JS такое же?
65536, пишите решением, отмечу. Ещё раз спасибо за потраченное вами время.
Николай Чуприк, https://gist.github.com/HatScripts/e971eed73d9afae...
Николай Чуприк, да вы протестируйте сначала. вдруг не прокатит.

расширение надо ставить

Answer 1 · 2020-07-16 16:38:24

diff/xdiff - это решение так себе. Скорее, хак.
Пока появилась такая мысль: представил бы действия в виде массива элементов наподобие такой структуры:

UserAction
  ts - UNIX timestamp
  key - параметр
  value - его значение

Каждое такое действие - это патч над структурой, полученной предыдущими действиями. Можно отправлять на сервер и при записи сверять по времени записи в БД.

Answer 2 · 2020-07-16 17:34:32

приводит к очень большой битовой разнице

Чтобы этого избежать используют метод скользящего окна.

Только вот на малых объемах данных это бессмысленная трата ресурсов.
А сделать можно. Но это будет иметь смысл на когда данные имеют размер десятки мегабайт и более. В противном случае накладные расходы превышают полезный эффект.

Тем более если речь идет о БД - там процессорное время стоит в разы дороже чем лишняя пара килобайт.

Как реализовать инкрементное (дифференциальное) хранение строк?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт