Александр +: архитектурные проблемы нужно решать, а не откладывать на потом.
Насколько я понял, при работе с MariaDB ColumnStore ничего не меняется с точки зрения подключения к СУБД: остаётся та же строка подключения, тот же драйвер, что и к MySQL. Во всяком случае, имеет смысл проверить этот вариант.
(комментарий полезен и для freeeeez ).
Задача описана неполно. Неясны цели. Тем не менее, задача о подключении RoR к двум БД должна нагугливаться без проблем.
Рекомендую обновить вопрос, добавив метки "хранение данных", "Базы данных".
Файл возможно уже невосстановим. Если нечего прятать, выложи архив с файлом под паролем, скажем, в Яндекс.Диск. Может у кого-то получится восстановить. Пароль выложи здесь в комментариях.
Антон Иванов: Во как! Спасибо за наводку для nginx.
На данном этапе архитектура веб-сервиса только разрабатывается и ещё не ясно что будет выступать в роли фронтального веб-сервера.
Антон Иванов:
> Сейчас Вы пишете, что вам надо, чтобы браузер сохранял файл в .gz
Нет, я имел в виду распаковку содержимого архива.
> Качать надо file.csv
То есть имея на сервере файл file.csv.gz, нужно просить как file.csv?
Но эта распаковка касается сжатых данных, полученных по сети, таким образом, на входе у браузера всё равно тот же gz, который ему и передали. А мне нужно, чтобы браузер понимал сам как сохранить содержание файла в gz.
Антон Иванов:
> браузеру отдается заголовок, говорящий о том, что это gzip. Браузер это понимает и сохраняет файл/показывает страницу в распакованом виде
Вообще-то скачивая через браузер файл gz, то я и получаю его таким же, а не распакованным. Распаковка, даже опциональная, в любом случае происходит на стороне веб-клиента.
konura: можно, только я давно не работал с Матлабом и поэтому если вопрос окажется менее тривиальным, чем мне кажется, то тогда не факт что смогу помочь. В общем, если тебе нужно срочно, то тогда нет смысла отправлять. Может, вечером смогу глянуть.
Рустам Салаватов: Алгоритм pHash находит различия в изображения, между которыми небольшие отличия в цвете, когда объект немного сдвигается с места, изображение перевёрнуто по вертикали. Отличия выражаются в расстоянии Хэмминга между двумя хэшами, которое можно подобрать экспериментально, в зависимости от нужд, или использовать в запросах каждый раз как пользовательский параметр.
В SQL запросе выше определяются любые дубликаты в коллекции изображений.
Для определения дубликатов у заданного изображения нужен другой запрос:
SELECT hamming_distance('e00e2f5e780fe7c0', phash) as dist, name FROM images
WHERE dist between 1 and 8
Проект мой экспериментальный, он едва начат и ещё не производил замеров скорости отклика. Пока использовал лишь SQLite. Нужно произвести замеры и постараюсь позже написать результаты.
Ведь "информация в виде текста" это несколько расплывчатая информация.