Как в ядре вызвать ядро?

Question

Клай @Pushunter

Как в ядре вызвать ядро?

Здравствуйте, пишу нейронную сеть для распознавания цифр (для начала) на CUDA. Нужно написать функцию на устройстве, которая в каждом блоке вызывает функцию тренировки нейронной сети. Всего тренировок, а значит и блоков, должно быть 60 000. Сама функцию тренировки у меня написана, но она тоже выполняется на устройстве. Точнее не вся функция, а определенный фрагменты кода, вроде перемножения матриц, выполняются на устройстве. И выходит, что мне нужно написать функцию на устройстве, которая параллельно с помощью блоков вызовет 60 000 тренировок сети, но каждая тренировка тоже выполняется на устройстве ( при ее вызове нужно указывать также сетку и блоки ). Как такое реализовать?

Спасибо большое за любой совет/подсказку/наставление. Я только учусь, и поэтому набивание синяков для меня привычное дело...

Вопрос задан более трёх лет назад
71 просмотр

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Анимация

+1 ещё

Простой
Существет ли AI делающая промежуточную анимацию между 2 кадрами?
- 1 подписчик
- 09 авг.
- 80 просмотров
1

ответ
Нейронные сети

Простой
Существуют ли нейросети делающие видео с персонажем по эскизу фото?
- 1 подписчик
- 08 авг.
- 80 просмотров
1

ответ
Видео

+1 ещё

Простой
Есть ли видео-нейросеть, дорисовывающая объекты к реальному видео?
- 1 подписчик
- 03 авг.
- 149 просмотров
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 263 просмотра
3

ответа
Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 41 просмотр
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 55 просмотров
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 65 просмотров
0

ответов
Видеокарты

+2 ещё

Простой
Существует ли софт, позволяющий задействовать всю мощь CUDA при кодировании видеофайлов?
- 2 подписчика
- 19 июл.
- 725 просмотров
2

ответа
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 63 просмотра
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 224 просмотра
3

ответа
Показать ещё Загружается…

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

JS Fullstack Инженер (Node.js + Vue.js)

SteadyControl • Воронеж

от 100 000 до 250 000 ₽

Сетевой инженер

МТС • Владивосток

от 100 000 ₽

Answer 1 · 2019-05-18 07:47:44

Нельзя вызвать ядро __global__ функцию на GPU, только на CPU можно. (Хотя может существовать какой-то способ, который я не знаю, но в книге по CUDA нельзя)

Вы можете данные нужные в памяти оставить и вызвать доп ядра из CPU. Или создать __device__ функции и вызывать их на GPU.

Answer 2 · 2019-07-04 13:20:43

Вызывать ядро в ядре можно. Это называется динамический параллелизм
https://devblogs.nvidia.com/cuda-dynamic-paralleli...

Как в ядре вызвать ядро?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт