TensorFlow 2.0 GPU Win10 GTX1050Ti почему медленней CPU?
Ноутбук MSI GL83 8RD
CPU i7-8750H
GPU GTX 1050 Ti
ОЗУ 16гб
Windows 10
TensorFlow 2.0, tensoflow-gpu, cuda.
Почему обучение на моей GTX 1050 Ti раза в 2 или 3 медленней чем на CPU? Пробовал по разному и устанавливал tensorflow 2.0 и 2.1, даже собирал из исходников один результат.
Я что то не так делаю, или так и должно быть??
Overhead на перегонку данных в GPU и обратно может быть слишком большим относительно времени вычисления в вашей конкретной задаче. Кроме того, в самом Tensorflow полно очень медленных функций, самописный аналог которых может быть на 1-3 порядка быстрее. Также может влиять разрядность чисел - например, посмотрите сюда: Как ускорить перемножение матриц в numpy?