Я имел в виду следующее:
логика там несложная, берётся матрица, которая заполняется двухмерным массивом нитей. Так вот эта матрица никогда не может быть нулевой, в первом же шаге я приравниваю к единице все диагональные элементы. Тем не менее, и при отладке, и в конечном итоге оказывается, что матрица состоит только и исключительно из нулей, причём никаких ошибок не выдаётся
Я в ступоре, на самом деле. Похоже, я где-то всё-таки ошибся, но как-то очень уж странно, что я никак это отловить не могу и что программа почти везде работает правильно
Спасибо, что проверили!
Спасибо, но эти статьи я читал — они слишком старые (2008 год). Мне как раз интересно, изменилось ли что-нибудь с тех пор, т.к производительность видеокарт выросла очень значительно
Ну по поводу cuda написано, что скорость копирования из host в device ограничена именно реальной скоростью передачи данных на pci-express, при этом это самая дорогая операция из всех, я потому и спросил
По поводу «точной» вопрос возник из-за того, что у меня материнская плата Gigabyte EP35C-DS3R на чипсете P35. Так вот производителем заявлено то, что она работает на pci-express 2.0, в документации на чипсет написано, что чипсет поддерживает только версию 1.1, а Everest показывает, что pci-express вообще первой версии. Так вот в связи с расходящимися данными и возник вопрос, где написана неправда, и почему же Gigabyte не получил поток критики в связи с обманом в описании. Я подумал, что возможно, они как-то исхитрились и сделали что-то среднее, но как проверить своё предположение, я не знаю
Значит, ошибка где-то у меня, к моему сожалению