Можно ли использовать несколько видеокарт для ускорения научных расчетов на языках С++ или Python?

Question

bobrikan @bobrikan

Можно ли использовать несколько видеокарт для ускорения научных расчетов на языках С++ или Python?

В данный момент я занимаюсь научными расчетами (считаю матрицы, что хорошо параллелится). Если изначально всё начиналось с последовательных расчетов на CPU на python, то довольно скоро пришла идея о параллелизации на CPU, а потом и CUDA (использую библиотеку numba на языке python). И результаты очень неплохи. Однако все же дошли до того момента, что даже на 1080ti счёт занимает более 15 часов.

Итак вопросы.
1) Насколько Tesla V100 считает быстрее чем 1080ti?
2) Насколько будут ускоренны расчеты при переходе на с++?
3) Можно ли использовать несколько GPU для расчетов одновременно на питоне? То есть конечно можно разбить руками матрицу на 4 части, руками же запустить 4 одинаковых кода (единственное различие в коде будет в присвоении коду видеокарте cuda.device_select(n)), а потом ручками же соединить 4 матрицы и получить искомую матрицу, но это очень хлопотно.
4) Аналогичный вопрос про с++
Искал в интернете инфу - не нашел.

Вопрос задан более трёх лет назад
865 просмотров

4 комментария

Подписаться 3 Средний 4 комментария

semen-pro @semen-pro

что внутри cuda.device_select(n)) ? может там можно что-то вроде "all" прописать

Написано более трёх лет назад
Армянское Радио @gbg

А вы проверяли, что у вас в течении этих 15 часов питон не занимается, в основном, пересылкой данных по PCI-E, а GPU - простаивают?

Написано более трёх лет назад
bobrikan @bobrikan Автор вопроса

Армянское Радио, я пересылаю данные только один раз, а также мониторил загруженность видеокарты - она практически всегда загружена на 100%

Написано более трёх лет назад
bobrikan @bobrikan Автор вопроса

semen-pro, нельзя. Там именно номер
"Create a new CUDA context for the selected device_id. device_id should be the number of the device (starting from 0; the device order is determined by the CUDA libraries)."

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

Комментировать

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 190 просмотров
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 129 просмотров
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 110 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 245 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 130 просмотров
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 137 просмотров
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 138 просмотров
0

ответов
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 251 просмотр
2

ответа
Python

Простой
Не могу разобраться почему не работает код python?
- 1 подписчик
- 22 окт.
- 422 просмотра
1

ответ
Python

Простой
Какие есть удобные API для генерации картинок через AI?
- 3 подписчика
- 20 окт.
- 287 просмотров
1

ответ
Показать ещё Загружается…

Backend developer (Python, FastAPI)

BCraft

До 4 000 $

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python разработчик

ITK academy • Казань

от 75 000 ₽

что внутри cuda.device_select(n)) ? может там можно что-то вроде "all" прописать
А вы проверяли, что у вас в течении этих 15 часов питон не занимается, в основном, пересылкой данных по PCI-E, а GPU - простаивают?
Армянское Радио, я пересылаю данные только один раз, а также мониторил загруженность видеокарты - она практически всегда загружена на 100%
semen-pro, нельзя. Там именно номер
"Create a new CUDA context for the selected device_id. device_id should be the number of the device (starting from 0; the device order is determined by the CUDA libraries)."

Answer 1 · 2020-02-01 12:30:43

Владимир Коротенко @firedragon

Не джун-мидл-сеньор, а трус-балбес-бывалый.

Смотрите.
https://www.microway.com/knowledge-center-articles...

Единственная проблема теслы это стоимость

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2020-02-01 13:27:52

Зависит от алгоритма и его реализации. Может быть примерно с такой же скоростью может на несколько процентов быстрее, или на несколько порядков быстрее.
Не факт что будут ускорены. А если будут - зависит от многих факторов, предсказать нельзя.
Да. Автоматизируйте хлопотные вещи.

Answer 3 · 2020-02-01 14:15:42

Просто оставлю это здесь в качестве иллюстрации разгона перемножения матриц в 330 раз без всяких GPU:
Как ускорить перемножение матриц в numpy?

Answer 4 · 2020-02-02 18:12:02

По моему опыту - разница между python и c++ будет пренебрежительно малой в данном случае, ведь сами расчёты на устройстве, а хост только за I/O и общую логику отвечает. Не работал с CUDA, но для OpenCL все упирается в копировании данных с/на GPU и запись в файлы. Нужно профилировать. Также слышал, что можно замапить область памяти с RAM или даже ROM напрямую в адресное пространство GPU. Что поможет избежать лишнего копирования(но я лично не пробовал).
По поводу использования нескольких GPU. Использовал. Даёт ускорение примерно в 0.9n - 0.95n, где n-количество вычислителей. На хосте получаются данные о примерной производительности каждого устройства, вся задача пропорционально делится на части и запускается. Потом на хосте собираются результаты.

Можно ли использовать несколько видеокарт для ускорения научных расчетов на языках С++ или Python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт