Наиболее эффективная реализация алгоритмов преобразования BWT и MTF?

Question

Airat Galiullin @agaliullin

ИТ наставник

Наиболее эффективная реализация алгоритмов преобразования BWT и MTF?

BWT (Burrows-Wheeler Transform) и MTF (Move-to-Front) очень интересные алгоритмы преобразования информации перед сжатием. Эффективно подходят для текстовых данных. Знаете ли вы интересные реализации данных алгоритмов (!проверенные), на любом языке программирования. И в связки с каким алгоритмом сжатия вы бы применили данные преобразования?
P.S.: особенно интересна реализация на Node.js

Вопрос задан более трёх лет назад
958 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Node.js

+1 ещё

Простой
Как авторизоваться в marzban?
- 1 подписчик
- 25 июл.
- 47 просмотров
1

ответ
JavaScript

+3 ещё

Простой
Почему при отправке HTML-формы данные не поступают в mysql?
- 1 подписчик
- 25 июл.
- 180 просмотров
1

ответ
Программирование

Простой
Как готовиться к ВСоШ по информатике 9-11 классов/олимпиадам по программированию вообще?
- 1 подписчик
- 20 июл.
- 165 просмотров
2

ответа
Node.js

+1 ещё

Простой
Допустимо ли внедрить use-cases в Express.js с архитектурой MVC?
- 1 подписчик
- 19 июл.
- 113 просмотров
0

ответов
Node.js

+2 ещё

Простой
Как оптимизировать производительность Node.js при запуске множества фоновых Telegram-ботов?
- 1 подписчик
- 16 июл.
- 261 просмотр
2

ответа
Node.js

Простой
Как создать пользователя в marzban?
- 2 подписчика
- 10 июл.
- 416 просмотров
1

ответ
Программирование

+1 ещё

Простой
Ответьте на вопрос по информатике?
- 1 подписчик
- 10 июл.
- 675 просмотров
3

ответа
PHP

+2 ещё

Простой
Есть web-сервер на php или nodejs который поддерживает работу с .htaccess?
- 1 подписчик
- 07 июл.
- 1682 просмотра
5

ответов
Алгоритмы

+1 ещё

Средний
Как можно предиктить дату регистрации при массиве данных?
- 1 подписчик
- 03 июл.
- 124 просмотра
1

ответ
Программирование

+1 ещё

Средний
Редактирование прошивки китайской камеры видеонаблюдения?
- 1 подписчик
- 01 июл.
- 346 просмотров
1

ответ
Показать ещё Загружается…

Middle backend developer (Node.js)

Самозанятые.рф • Москва

от 220 000 ₽

Fullstack Node.js Developer / Backend разработчик

United Digital Solutions • Казань

от 250 000 ₽

Senior Node.js developer

Vortex • Москва

от 330 000 до 380 000 ₽

Answer 1 · 2017-09-11 17:06:19

Насчёт более эффективной не знаю, но Mark Nelson полагает (1996), что данная схема достаточно эффективна:

RLE input-file | BWT | MTF | RLE | ARI > output-file

A brief description of each of the programs follows:
RLE.CPP This program implements a simple run-length encoder. If the input file has many long runs of identical characters, the sorting procedure in the BWT can be degraded dramatically. The RLE front end prevents that from happening.
BWT.CPP The standard Burrows-Wheeler transform is done here. This program outputs repeated blocks consisting of a block size integer, a copy of L, the primary index, and a special last character index. This is repeated until BWT.EXE runs out of input data.
MTF.CPP The Move to Front encoder operates as described in the previous section.
RLE.CPP The fact that the output file is top-heavy with runs containing zeros means that applying another RLE pass to the output can improve overall compression. I believe that further processing of the MTF output will provide fertile ground for additional improvements.
ARI.CPP This is an order-0 adaptive arithmetic encoder, directly derived from the code published by Witten and Cleary in their 1987 CACM article.

marknelson.us/1996/09/01/bwt
К статье также прилагаются исходные тексты программ на Си++.

А есть исходники BWT и MTF на JS: https://gist.github.com/SKAhack/14b2dfc4208349f00799

Answer 2 · 2017-09-13 18:08:40

Вот тут посмотрите: https://stackoverflow.com/questions/7857674/whats-...

Идея - построить суффиксный массив (что почти тоже самое, что BWT). Там рекомендуют libdivsufsort. Вроде как, его можно использовать и в node.js: https://www.npmjs.com/package/divsufsort

Наиболее эффективная реализация алгоритмов преобразования BWT и MTF?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт