Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Сергей Тихонов
бекенд-разработчик на python
375
вклад
8
вопросов
478
ответов
51%
решений
Ответы пользователя по тегу
CUDA
CUDA как правильно оптимизировать?
Сергей Тихонов
@tumbler
бекенд-разработчик на python
Во-первых, стоит удостовериться, что Вы измерили именно скорость выполнения кода, а не загрузки данных, выполнения и выгрузки результата.
Во-вторых, попробуйте избавиться от if совсем (можно добавить неиспользуемые поля до размера блока).
В-третьих, используйте векторное умножение вместо отдельных операций в три строки.
В-четвертых, посмотрите размеры блока для вашей карты, может не влезаете.
Ответ написан
более трёх лет назад
1
комментарий
Нравится
1
1
комментарий
Разница в подсчете времени?
Сергей Тихонов
@tumbler
бекенд-разработчик на python
Принципиально разница в том, что интерфейс cuda асинхронный, т.е. время между start/stop будет менять скорость отправки кода на GPU.
Ответ написан
более трёх лет назад
Комментировать
Нравится
1
Комментировать
Оценили как «Нравится»
Закрыть
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама