Какой ток - постоянный или переменный.
Какой ток по порядку величины - амперы, миллиамперы?
Какая нужна точность?
Можно ли объединить земли схемы измерения и нагрузки?
DeOxygen, разбиение на тайлики - "нормальный", как вы выражаетесь, алгоритм, он и на CPU будет работать.
В целом, когда речь идет о каких-то оптимизациях и ускорениях, надо выяснить в первую очередь, а что у вас тормозит - вычисления или пересылка в видеокарту.
ehevnlem, мой вам добрый совет - сначала запрограммируйте обычное умножение матриц 64к*64к, хотя бы по порядку времени похожее на то, что делает MKL. Этой задачи как раз достаточно для тотального погружения во все аспекты HPC и оптимизацию вычислений.
Кстати, самый большой выигрыш у умножении матриц дает не использование злых инструкций процессора, а алгоритм Штрассена.
А потом уже пытайтесь сделать убийцу TensorFlow и прочие достижения науки.