Как посмотреть не знаю, но OpenGl по сути своей спецификация, реализуемая в конкретной библиотеке, которая по существу своему реализует интерфейс между драйверами видео и твоей программой, так что OpenGl не должен юзать проц.
И что это вы имели ввиду насчет "конкретного" рендеринга еще и с явной отправкой на GPU? Насчет явной, это уж зависит от либы.
На счёт "конкретного" имею ввиду следующее: я реализовал некоторые алгоритмы рендеринга вплоть до собственной реализации отрисовки линии. Линия рисуется попиксельно через setRGB. Но параллель на 8 ядер процессора незначительно увеличивает производительность - фпс сильно падает при простом увеличении трёхмерной фигуры.
Хотел узнать, как можно все вычисления распараллелить не на 8 потоках проца, а на 640 потоках видеокарты.
tukal-off: не вдавался в подробности, но этим по идее должен заниматься драйвер видео карты, наверное не зря у nvidia он весит чуть ли не 100 мегабайт, так что что б ручками там навести порядок, я думаю не вариант, как минимум из за не хватки знаний и времени, а во вторых, видео карты ее конвеер должен заботиться, что бы твои вершины параллельно считались.