Линус Торвальдс и последние комментарии об AVX-512?

Question

mrbaranovskyi @mrbaranovskyi

Процессоры

Линус Торвальдс и последние комментарии об AVX-512?

В сети шумят новости от том, что Торвальдс достаточно жестко высказался по поводу новых инструкций, которые появятся в новой версии GCC. Речь идёт он новых 512-битных AVX.
Из того, что я понял, этот сет инструкций немного умешьшает частоты (серьёозно??). Основной посыл его комментариев был направлен на то, что компаниям нужно улучшать обычную математику, нежели добавлять что-то столько "ужасное".

Для меня не очень понятно, почему столь ужастное. К примеру, 512-битной инструкции хватит, чтобы произвести над 4x4 матрией с плавающей точкой. Звучит очень неплохо, особенно для тех кто занимается процессингом геометрии.

Не силён в теме и мне не очень ясны аргументы. Может кто-то может в двух словах пояснить чём плюсы в чём минусы?

Вопрос задан более трёх лет назад
227 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

1C-разработчик

8 месяцев

Далее
Нетология

Python-разработчик с нуля

6 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Компьютеры

+3 ещё

Средний
Почему не отображаются показатели Ryzen 5 9600x в RivaTuner?
- 1 подписчик
- 14 нояб.
- 93 просмотра
1

ответ
Мониторы

+2 ещё

Средний
В чём может быть причина такого артефакта на мониторе?
- 2 подписчика
- 04 нояб.
- 421 просмотр
1

ответ
Процессоры

Простой
Возможна ли работа с монитором без графического ядра?
- 3 подписчика
- 04 нояб.
- 433 просмотра
3

ответа
Железо

+1 ещё

Простой
Какую СЖО поставить под i7-13700kf в такой корпус?
- 1 подписчик
- 31 окт.
- 291 просмотр
2

ответа
Процессоры

Простой
Какие команды нужны для моего процессора?
- 1 подписчик
- 28 окт.
- 221 просмотр
1

ответ
Компьютеры

+1 ещё

Простой
Можно ли запустить проц без термопасты?
- 1 подписчик
- 19 окт.
- 530 просмотров
4

ответа
Ноутбуки

+2 ещё

Простой
Почему греется процессор в разобранном ноутбуке?
- 1 подписчик
- 18 сент.
- 304 просмотра
2

ответа
Мониторы

+2 ещё

Простой
От чего зависит версия видеовыходов на материнской плате при использовании встроенной графики процессора?
- 2 подписчика
- 02 сент.
- 388 просмотров
1

ответ
Железо

+3 ещё

Средний
Что лучше всего заменить в системе для стриминга?
- 1 подписчик
- 21 авг.
- 386 просмотров
3

ответа
Компьютеры

+2 ещё

Простой
Достаточно ли связки i5 13400 и 5060 для разностороннего использования компьютера?
- 1 подписчик
- 02 авг.
- 483 просмотра
3

ответа
Показать ещё Загружается…

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 350 000 ₽

Answer 1 · 2020-07-15 13:40:01

Снижение частоты вполне реально. Столь длинный массив на кристалле микросхемы непросто синхронизировать. Именно по этой причине видеокарты, VLIW-процессоры и любой вычислительный узел с параллельным вычислением работают всегда на пониженной частоте. Хотя на практике производитель может пойти на ухищрения и хитрости. Например, вместо вычисления одновременно 8 элементов будет четыре раза по два элемента. Это как пример. Есть реальный пример: Pentium 4, внутри АЛУ у него 16-разрядный. Для вычисления 32-разрядного элемента АЛУ выполняет в две стадии. Зато можно повысить частоту. Именно этим и объясняется столь длинный конвейер.

А критику Торвальдса я как-то могу понять. AVX512 фактически дублирует существующие, используя более длинные регистры. Ещё читал разные материалы по поводу. AVX512 разбит на части, и будет поддерживаться в разных моделях по-разному. Представляете, какой геморрой будет у разработчиков компиляторов? Хотя, в общем, система команд x86/x86-64 всегда славилась бардаком (удивительно, что они ещё умудряются быстро выполнять команды). Я и не говорю о трудностях разработчиков уже конечных программ, как САПР, мультимедийные редакторы и прочее. Это, получается, надо указывать дополнительно, какие именно процессоры нужны. Это сильно сужает выбор. Но он прав, что лучше улучшать технологию в многопоточности. Ведь не каждый день будете вычислять матрицу 4х4. А вдруг захотите вычислить матрицу 5х5? Проблема. А многопоточностью всегда можно управлять. Например, я всегда отдаю предпочтение многопоточной реализации в разработке. Проще разрабатывать и контролировать. Когда ненужна высокая производительность, можно отключить ненужные ядра. Да. Я забыл добавить, что увеличение команд для x86/x86-64 неизбежно приводит к росту размера памяти микроопераций, который находится в процессоре.

А если всё-таки нужна такая длинная операция, то тогда это лучше передать ускорителю вычислений. Например, видеокарты. Они давно умеют с этим работать. И регистры у них очень длинные. Можно реализовать в виде APU, как у AMD. Это куда практичней.

Answer 2 · 2020-07-13 17:35:58

xmoonlight @xmoonlight

https://sitecoder.blogspot.com

Обратитесь к первоисточнику и не играйте здесь в "сломанный телефон".

Ответ написан более трёх лет назад

2 комментария

Линус Торвальдс и последние комментарии об AVX-512?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт