Как работает аппаратное распараллеливание?

Question

TimkaTV @TimkaTV

Процессоры

Как работает аппаратное распараллеливание?

Добрый день,
Прощу прощения за возможно детский вопрос.
Собственно хотелось бы знать применяется ли аппаратное распараллеливание инструкций на процессоре?
Как возможно реализовать подобное?

И еще. Как операционная система выбирает ядро для исполнения (к примеру на x86-64). Возможно какой-то регистр, с помощью которого схема выбора дает сигнал разрешения? Спасибо!

Вопрос задан более трёх лет назад
584 просмотра

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик

9 месяцев

Далее
Skillbox

Профессия 1С-программист

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

3 комментария

TimkaTV @TimkaTV Автор вопроса

Mercury13 , большое спасибо за ответ. Вопрос был немного в другом. Как на уровне инструкций выбирает исполнительное ядро. В x86 есть инструкция cpuid позволяющая прочитать о параметрах процессора (кол-во ядрер, например). Как ,грубо говоря, переключить (программно) исполнительное ядро, чтоб следующие инструкции выполнялись на нем.

Написано более трёх лет назад
Mercury13 @Mercury13

Выбором из нескольких вычислительных ядер (в том числе виртуальных, составленных из недействующих блоков, как в мультитрединге) занимается ОС, и это уже не ко мне, а к Сергей Протько.

Написано более трёх лет назад
Mercury13 @Mercury13

Ошибся — гипертрединг, разумеется.

Написано более трёх лет назад

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Процессоры

Простой
Какой сокет Интел лучше выбирать сейчас?
- 1 подписчик
- 16 мар.
- 290 просмотров
1

ответ
Процессоры

Простой
Многие игры не догружают процессор даже до 35% что делать?
- 1 подписчик
- 15 мар.
- 229 просмотров
1

ответ
Процессоры

Простой
Загрузка цп 100 при открытии любого браузера?
- 1 подписчик
- 03 февр.
- 394 просмотра
2

ответа
Серверное оборудование

+3 ещё

Средний
Как избавиться от сообщения с просьбой привязать процессор на сервере Dell R7525 и при этом не привязывать его?
- 3 подписчика
- 04 янв.
- 344 просмотра
1

ответ
Компьютеры

+2 ещё

Простой
4 пин питание проц в 8 пин разъем можно ли?
- 1 подписчик
- 29 дек. 2025
- 404 просмотра
2

ответа
Процессоры

+1 ещё

Простой
Почему Intel Core i7-14700 (Raptore Lake Refresh) не выходит за пределы 65 ватт?
- 1 подписчик
- 20 дек. 2025
- 354 просмотра
1

ответ
Компьютеры

+3 ещё

Средний
Почему не отображаются показатели Ryzen 5 9600x в RivaTuner?
- 1 подписчик
- 14 нояб. 2025
- 156 просмотров
1

ответ
Мониторы

+2 ещё

Средний
В чём может быть причина такого артефакта на мониторе?
- 2 подписчика
- 04 нояб. 2025
- 632 просмотра
1

ответ
Процессоры

Простой
Возможна ли работа с монитором без графического ядра?
- 3 подписчика
- 04 нояб. 2025
- 501 просмотр
3

ответа
Железо

+1 ещё

Простой
Какую СЖО поставить под i7-13700kf в такой корпус?
- 1 подписчик
- 31 окт. 2025
- 434 просмотра
2

ответа
Показать ещё Загружается…

Разработчик программного обеспечения авионики

Котлин-Новатор • Санкт-Петербург

от 70 000 до 200 000 ₽

Инженер 2 линии техподдержки

MosLine • Москва

от 90 000 до 100 000 ₽

Менеджер по продажам B2B (Senior)

Payselection • Москва

До 250 000 ₽

Answer 1 · 2016-01-08 04:25:10

Попробую рассказать.

Шаг 1. Конвейерная архитектура (Pentium 1).
Чем-то напоминает многоствольный пулемёт. Один патрон заряжается, другой выстреливается, третий выбрасывается. Стоп… Одна команда выбирается, вторая декодируется, третья и четвёртая исполняются.

Шаг 2. Суперскалярность (Pentium то ли Pro, то ли MMX).
У нас есть несколько исполнительных блоков (в данном случае целочисленных). Если команды не противоречат друг другу, их можно пустить на обоих блоках параллельно.

Шаг 3. Микрокоманды и VLIW (если не ошибаюсь, из x86 первым реализован в Transmeta Crusoe).
Состоит из таких этапов.
1. Разбиваем операции x86 на микрокоманды — например, «перебросить из eax в сумматор», «сдвинуть содержимое сумматора на 1 вправо»…
2. Собираем это самое «очень длинное слово операции» из микрокоманд, заботясь о том, чтобы не было зависимостей по данным. Один сумматор получает слово из eax, а параллельно второй сдвигает на 1. Каждый из разрядов «длинного слова» управляет своим блоком процессора: сумматором, памятью, вводом-выводом…
3. Ну и исполняем это самое слово.

Всем этим архитектурам важно т.н. предсказание ветвлений. Чтобы всё это дело работало, нужно, чтобы несколько операций были декодированы наперёд. Проблема — ветвление: если мы не угадаем, случилось ли ветвление, вся предварительная работа насмарку. В микроконтроллерах с коротким конвейером и предсказуемым до такта временем работы мы на это чхаем: например, в инструкции к AVR говорится, что там двухместный конвейер: один такт декодирование и один (два, три) — исполнение. Обычно такт на декодирование не важен (и не указан в инструкции), но мы теряем его, если случился переход.

А в x86 алгоритмы предсказания ветвлений довольно сложны.

ЗЫ. В суперскалярных процессорах несколько десятков регистров, на которые динамически навешиваются ярлыки: сейчас EAX=r5, а через две команды — уже r13. Так называемое «переименование регистров».

Answer 2 · 2016-01-08 02:04:40

ну вот представьте. Есть у вас поток команд. Скажем подряд идут команды в духе "сложи мне два числа", "скопируй значение из памяти в регистры", "пошли что-то на шину что бы к девайсу ушло". Для всех этих трех операций нужны разные штуки. Для первой - свободный АЛУ, для второго - управляющие сигналы на оперативку послать, для третьего - третье. И все эти операции занимают сильно по разному времени.

Вывод - мы можем отсортировать команды на этапе конвееризации процессора и таким образом отправлять на обработку команды по мере доступности ресурсов.

Или например... есть у нас у ядра процессора аж 4 АЛУ. То есть мы по хорошему можем сразу 4 арефмитические операции выполнять. Можно распаралелить если команды подряд идут.

Вообще тут лучше почитать по конвееризации процессоров. Это весьма жирная тема.

Как операционная система выбирает ядро для исполнения

Почитайте про планировщики, например вот: Process Scheduling in linux

Как работает аппаратное распараллеливание?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт