Почему sub быстрее, чем add?

Question

belk @belk

Assembler

Почему sub быстрее, чем add?

Я провёл измерение времени выполнения разных инструкций и обнаружил, что инструкция sub выполняется до 2.5 раз быстрее инструкции add. Естественно, не поверил, сгенерировал кучу тестов.

Методика тестирования:

Тест состоит из двух файлов, .asm и .cpp.

В .asm объявлены две процедуры: одна состоит из N инструкций add rax, rax, вторая – из стольки же sub rax, rax.

В .cpp работает цикл, который M раз случайным образом (чтобы не было закономерностей) вызывает одну из двух процедур и измеряет время её выполнения. В итоге для обеих процедур выводится среднее количество тиков, затраченных на одну инструкцию. Оптимизация компилятором отключена.

В качестве N и M выбираются все пары из списка [10, 100, 1000, 10000, 100000], кроме тех, в которых N*M превышает 10^8.

Каждый тест запускается 100 раз, результат усредняется. Тестирование проводилось на не нагруженной машине.

Если посмотреть на гистограмму, видно, что вычитание сильно выигрывает в скорости. С чем такое может быть связано?

UPD: Заменил операнды на rax и rdx, всё встало на свои места. Всем спасибо.

Вопрос задан более трёх лет назад
4178 просмотров

3 комментария

Подписаться 3 Оценить 3 комментария

dlinyj @dlinyj

А что говорит справочник по количеству тактов на каждую инструкцию?

Написано более трёх лет назад
dlinyj @dlinyj

Так же можно точную модель процессора, и желательно ссылку на его даташит. Я поглядел даташит на абстрактный AMD64, не нашёл там ответа.

Написано более трёх лет назад
VenomBlood @VenomBlood

С появлением суперскалярных процессоров, блоков предсказаний и прочих ухищрений (которых в современных процессорах куча) количество тактов на инструкцию перестало быть цифрой, на которую можно ориентироваться. Не то чтобы она теперь бесполезна, но она теперь является далеко не единственной и не определяющей.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

GOLANG NINJA

Искусство работы с ошибками и безмолвной паники в Go (Golang)

9 недель

Далее
GOLANG NINJA

Искусство безмолвной паники в Go (Golang)

3 месяца

Далее

Решения вопроса 1

4 комментария

Пригласить эксперта

Ответы на вопрос 3

Комментировать

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Assembler

Средний
Как решить данную задачу?
- 2 подписчика
- 21 дек. 2025
- 236 просмотров
1

ответ
C++

+2 ещё

Простой
Как скомпилировать рабочую dll библиотеку?
- 3 подписчика
- 26 нояб. 2025
- 359 просмотров
1

ответ
Assembler

+2 ещё

Простой
Как заставить GCC (i686) генерировать реальный 16-битный код без использования EAX, ECX и т. д.?
- 1 подписчик
- 31 окт. 2025
- 143 просмотра
2

ответа
Assembler

Простой
Почему в коде assembler выдает бесконечный цикл?
- 1 подписчик
- 28 июл. 2025
- 213 просмотров
1

ответ
Linux

+2 ещё

Простой
Как сделать новое чтение из STDIN?
- 1 подписчик
- 25 мая 2025
- 237 просмотров
1

ответ
Linux

+2 ещё

Простой
GAS ассемблер: записать в секцию опкоды, затем выполнить их?
- 2 подписчика
- 25 мая 2025
- 211 просмотров
1

ответ
C

+2 ещё

Простой
Как реализовать файловую систему?
- 1 подписчик
- 22 мая 2025
- 378 просмотров
3

ответа
C#

+3 ещё

Простой
Почему код без условных переходов медленнее чем с ними? Ассемблер. Если должно быть наоборот?
- 1 подписчик
- 18 мая 2025
- 264 просмотра
0

ответов
Assembler

+1 ещё

Средний
Не работает customasm, как исправить?
- 1 подписчик
- 29 апр. 2025
- 101 просмотр
0

ответов
C++

+2 ещё

Простой
Покажите на ассемблере как выглядит защита от переполнения буфера?
- 2 подписчика
- 16 апр. 2025
- 9901 просмотр
3

ответа
Показать ещё Загружается…

Python Backend Developer

Hard Bootstrapping LLC. • Санкт-Петербург

от 250 000 до 500 000 ₽

Разработчик систем компьютерного зрения C++/Rust/Python

Битворкс

от 4 000 до 7 000 $

Golang Developer

SMALL

от 280 000 до 350 000 ₽

А что говорит справочник по количеству тактов на каждую инструкцию?
Так же можно точную модель процессора, и желательно ссылку на его даташит. Я поглядел даташит на абстрактный AMD64, не нашёл там ответа.
С появлением суперскалярных процессоров, блоков предсказаний и прочих ухищрений (которых в современных процессорах куча) количество тактов на инструкцию перестало быть цифрой, на которую можно ориентироваться. Не то чтобы она теперь бесполезна, но она теперь является далеко не единственной и не определяющей.

Answer 1 · 2012-12-06 12:17:19

sub reg, reg — специальный случай, обрабатываемый процессором также как и xor reg, reg, в этом случае специальный блок «ranamer» выполняет обнуление и удаляет инструкцию из pipeline еще до ее исполнения в engine.

Answer 2 · 2012-12-06 11:35:47

cypok @cypok

А попробуйте использовать два разных регистра?

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2012-12-06 11:51:03

Алексей @alexxxst

mov rax, 0

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2012-12-06 11:52:50

Сомнительные результаты конечно, но объяснение может крыться в следующем. Во некоторых RISC-процессорах вообще отсутствует возможность сложения и есть только команда вычитания. Сложение достигается инвертированием полученного результата командой NOT. Быть может тут такая же история, просто команду NOT уже делает процессор в своём кристалле, отсюда и идёт задержка.

Почему sub быстрее, чем add?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт