Как осуществлять операции с большими матрицами?

Question

mrgloom @mrgloom

Как осуществлять операции с большими матрицами?

Несколько общий вопрос.
В каком виде работают с большими матрицами?
Под словом большие подразумеваются матрицы, которые не помещаются в оперативную память.

Как хранить матрицы? Есть, например, формат HDF5(более продвинутое PyTables для python).
В идеале хотелось бы, чтобы строки матрицы можно было бы добавлять(т.е. было бы что то типа resize/append)

Я знаю, что в python и matlab есть свои варианты memory-mapped file.
В R есть тоже есть свои пакеты для работы с большими данными.

Понятно, что, скорее всего, можно было бы для каждого конкретного случая подобрать отдельный специализированный умный алгоритм(out-of-core), но хотелось бы, чтобы матрица хранилась на диске и к ней был прозрачный доступ, как к обычной матрице в памяти. Получается некоторая аналогия ram<->cache ram<->hdd.

Есть еще hadoop (mapreduce), но это уже несколько из другой области.

Вопрос задан более трёх лет назад
3413 просмотров

Комментировать

Подписаться 8 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 2

Комментировать

2 комментария

mrgloom @mrgloom Автор вопроса

я знаю что есть minibatch, out-of-core, randomized, stream алгоритмы. Но это именно вопрос о дизайне алгоритма, а я именно про то что я описал, чтобы программа не выдавала ошибку out-of-memory, а пусть долго, но работала.Причем это еще полезно, если я хочу чтобы моя программа использовала ограниченные ресурсы(например 200 мб).

Написано более трёх лет назад
Сергей @begemot_sun

Имхо.Способ хранения в вашем случае очень тесно перекликается с теми алгоритмами, которыми вы пользуетесь для обработки матриц. В каждом конкретном случае разная структура данных может быть по разному применима для разных алгоритмов, или вообще быть не применима.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Существуют ли сервисы: онлайн python editor для совместного использования?
- 1 подписчик
- 13 часов назад
- 53 просмотра
2

ответа
Машинное обучение

+1 ещё

Средний
Есть ли готовая архитектура модели, которая принимает на вход подобный формат данных?
- 3 подписчика
- 18 часов назад
- 53 просмотра
0

ответов
Python

Простой
На каком языке пишут описание функций в Python?
- 1 подписчик
- 26 сент.
- 250 просмотров
3

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 230 просмотров
1

ответ
Компьютеры

+2 ещё

Простой
За счёт чего быстрее работает компьютер?
- 1 подписчик
- 21 сент.
- 354 просмотра
5

ответов
Машинное обучение

+1 ещё

Простой
Поиск по образцу. Как сделать быстрый поиск вхождения картинок-символов на большом чертеже?
- 2 подписчика
- 19 сент.
- 169 просмотров
1

ответ
Python

Простой
Как парсить pdf-ки с вк с помощью Python?
- 1 подписчик
- 16 сент.
- 322 просмотра
1

ответ
Python

+1 ещё

Простой
Почему возникает синтаксическая ошибка: invalid decimal literal?
- 1 подписчик
- 15 сент.
- 168 просмотров
2

ответа
Python

+1 ещё

Простой
Почему модель обнаружения объектов YOLO работает медленно?
- 1 подписчик
- 14 сент.
- 188 просмотров
1

ответ
Python

Простой
Что можно улучшить или оптимизировать в коде, чтобы он не был таким длинным?
- 2 подписчика
- 10 сент.
- 437 просмотров
4

ответа
Показать ещё Загружается…

Python developer

Digital Clouds

от 160 000 ₽

Python разработчик

Selecty

от 280 000 до 380 000 ₽

Python разработчик

ITK academy • Казань

от 75 000 ₽

Answer 1 · 2015-02-14 14:42:51

Вот здесь описан интересный вариант решения задачи на Python:
matthewrocklin.com/blog/work/2015/01/14/Towards-OO...

Answer 2 · 2014-05-17 11:36:58

Может быть, вы неверно ставите задачу? Обычно поместить матрицу в память не является проблемой. Если все же проблема - работают minibatch-методы, либо что-то вроде online-обучения, где данные могут скармливаться в модель последовательно небольшими кусками.

Как осуществлять операции с большими матрицами?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт