На счёт "конкретного" имею ввиду следующее: я реализовал некоторые алгоритмы рендеринга вплоть до собственной реализации отрисовки линии. Линия рисуется попиксельно через setRGB. Но параллель на 8 ядер процессора незначительно увеличивает производительность - фпс сильно падает при простом увеличении трёхмерной фигуры.
Хотел узнать, как можно все вычисления распараллелить не на 8 потоках проца, а на 640 потоках видеокарты.