@Pushunter

Как распараллелить функции на cuda?

Здравствуйте, пишу нейросеть для распознавания цифр на cuda. Хочу получить максимум ускорения. На питоне 10 000 тренировок проходят за 20 секунд. На C++ за 10секунд. Вот теперь настал черед cuda. Есть класс neuralNet и в нем 3 функции: конструктор, тренировка и опрос. Как мне параллельно вызвать сразу несколько функций тренировки?Понимаю, что там нужны будут управляющие потоки и блокированная память, но мало с этим работал и не могу собрать все воедино.
Заранее спасибо за ответ)
  • Вопрос задан
  • 117 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы