Сомнительные результаты конечно, но объяснение может крыться в следующем. Во некоторых RISC-процессорах вообще отсутствует возможность сложения и есть только команда вычитания. Сложение достигается инвертированием полученного результата командой NOT. Быть может тут такая же история, просто команду NOT уже делает процессор в своём кристалле, отсюда и идёт задержка.