Двукратный прирост будет только при бесконечной пропускной способности памяти. Если не получится полноценно загрузить gpu — количество ядер эффекта не даст. Нужно, чтобы затраты на обработку данных настолько превосходили затраты на их чтение-запись в память, чтобы временем выполнения последних можно было пренебречь.