Как транспонировать биты числа максимально быстро?

Question

SergeySerge11 @SergeySerge11

Как транспонировать биты числа максимально быстро?

Допустим есть число 16 бит 4x4
1 1 1 1
0 0 0 0
0 0 0 0
1 0 0 1
его нужно повернуть в
1 0 0 1
1 0 0 0
1 0 0 0
1 0 0 1
Как сделать Без циклов и их разверток

Есть алгоритм, что бы его решить нужно транспонировать число, как это сделать, цикл или 32 операции для long числа делают алгоритм бессмысленным. можно ли как-то 4-8 битовыми операциями транспонировать число.

Еще есть ли вообще такие операции, как можно допустим число
биты которого 1111 заскелить в 0001000100010001 то есть каждый бит расматривать как разряд, допустим из 8 bit числа маски получить 64 битовое число, где каждый байт 0-1 в зависимости от 1 бита
Что-то вроде такого, можно ли сделать быстрее, ведь по факту в железе такую операцию легко реализовать одной ассемблерной инструкцией есть ли такая?

int b0=(15>>0)&1;
 int b1=(15>>1)&1;
 int b2=(15>>2)&1;
 int b2=(15>>3)&1;
 int res=b0| b1<<8 | b2<<16 | b3<<24

Вопрос задан более года назад
315 просмотров

2 комментария

Подписаться 2 Сложный 2 комментария

Помогут разобраться в теме Все курсы

Merion Academy

C# разработчик с нуля

4 месяца

Далее
Stepik

Профессия "C# разработчик"

1 неделя

Далее
Skillfactory

Профессия C#-разработчик

12 месяцев

Далее

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 3

3 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Java

+1 ещё

Средний
Как добавить цепочку сертификатов pkcs12 в java8 для взаимной аутентификации TLS?
- 2 подписчика
- вчера
- 75 просмотров
0

ответов
C#

+2 ещё

Простой
Каков вектор развития legacy-проекта на WinForms?
- 1 подписчик
- 03 дек.
- 118 просмотров
1

ответ
Android

+1 ещё

Средний
Сервис Android (aidl) с системными правами (в прошивке) может быть доступен для несистемного приложения?
- 1 подписчик
- 18 нояб.
- 84 просмотра
1

ответ
C#

+1 ещё

Простой
Как создать копию предмета и добавить ему компонент?
- 1 подписчик
- 08 нояб.
- 130 просмотров
1

ответ
C#

+1 ещё

Простой
Как сделать постраничную навигацию в Avalonia UI MVVM?
- 2 подписчика
- 08 нояб.
- 100 просмотров
0

ответов
Алгоритмы

Средний
Как создать алгоритм для ракеты в игре?
- 2 подписчика
- 30 окт.
- 266 просмотров
1

ответ
Алгоритмы

Простой
Как решать алгоритмические хакатоны и учится?
- 1 подписчик
- 27 окт.
- 179 просмотров
2

ответа
C#

Простой
Почему одинаковые делегаты работают по разному, В 10 Раз разница в скорости?
- 1 подписчик
- 27 окт.
- 289 просмотров
0

ответов
Java

+1 ещё

Простой
В чем моя ошибка при deploy maven?
- 1 подписчик
- 26 окт.
- 139 просмотров
1

ответ
C#

+1 ещё

Простой
Почему не работает обратная привязка в Avalonia UI?
- 1 подписчик
- 22 окт.
- 148 просмотров
1

ответ
Показать ещё Загружается…

C# WinForms .Net разработчик

Ляпунов и Резниченко • Санкт-Петербург

от 350 000 ₽

QA automation (C#)

Альфа-Банк • Москва

от 200 000 до 350 000 ₽

(KZ) Fullstack разработчик Middle+ / .NET + React / Трейдинг тематика

Jivestor • Алматы

До 2 600 €

ведь по факту в железе такую операцию легко реализовать одной ассемблерной

так возьми ассемблерную инструкцию и вызови её из языка
А как можно 32 бита в виде матрицы представить? Или она просто не квадратная?

Answer 1 · 2024-08-06 11:07:35

Занумеруйте все биты от 0 до 16. Потом транспонируйте эту матрицу. Потом посмотрите на разность результата и конца. Вот эти вот числа - это на сколько бит надо сдвинуть исходные биты, чтобы они встали на нужное место.

0 1 2 3
4 5 6 7
8 9 10 11
12 13 14 15

0 4 8 12
1 5 9 13
2 6 10 13
3 7 11 15

0 -3 -6 -9
3 0 -3 -6
...

Все биты с одинаковым смещением можно подсчитать за 3 операции: Сдвиг, битовая маска и побитовое или в ответ.
Я тут вижу 7 разных чисел -9,-6,-3,0,3,6,9.
Например, для 0 и 3 у вас будет

answer = (source & 0x1248) | ((source << 3) | 0x2480) | ...

Это не 8 пока еще операций, а аж 20. Возможно можно как-то еще их сгруппировать.

Edit: Возможно, еще подход с таблицей будет быстрее. Для каждого из 16 возможных значений строк выдавайте битовое число - столбец, где эти 4 бита на позициях 0, 4, 8,12. Тогда ответ будет table[source&0xf0] | (table[(source>>4)&0xf] << 1) | (table[(source>>8)&0xf] << 2) | (table[(source>>12)&0xf] << 3).

Тут 13 битовых операций и 4 чтения из памяти.

Answer 2 · 2024-08-06 14:23:03

Думаю, наиболее быстро будет с помощью предварительно сформированной таблицы подстановки - Look up table (LUT).
Просто создаете таблицу из 65536 16-битных чисел, где каждому индексу соответствует результат транспонирования. И берите готовый результат по индексу.

Answer 3 · 2024-08-06 16:21:11

Ищется функция вида

def transpose(matrix uint16) : uint16 = {}

Если она ДЕТЕРМИНИРОВАНА тоесть зависит от аргумента и все. То можно ее ускорить
путем МЕМОИЗАЦИИ тоесть создания просто таблицы расчитанных значений.
Это будет очень быстро.

Это удобно поскольку таблица получается не очень большая и влезает в разумные
рамки памяти. Если допустим мы говорим о 32х битах то можно изучать варианты.
В реальном мире линейного распределения аргументов не бывает. Распределение
всегда косит в какую-то сторону, и этим можно вользоваться, создавая кеши значений
типа LRU или дисковые базы данных как делают например, для
тяжелых расчетов или в вебе для медленных источников данных.

Answer 4 · 2024-08-09 09:03:02

Если вопрос стоит в том, как это сделать средствами исключительно логических операций - то см. ответ Wataru. 17 бинарных логический операций, если я правильно посчитал (с учетом того, что сдвиги на 9 и -9 можно маскировать совместно).
Если можно использовать LUT - то LUT, вероятно, будет выгоднее. Учитывая, что преобразование линейное - таблицу можно делить на части, выбирая между скоростью и памятью. Например, можно поделить на 2 части - отдельные таблицы для каждой половины из 16-битного входа, и получить расход 1кб памяти, 3 логических операции и два хождения в LUT.
Если речь о x86 cpu и можно использовать специфичные инструкции - то еще можно посмотреть в сторону sse/avx. Например, разбить вход побитово на байты и pshub, или (если есть XOP/AVX512) броадкаст его и vprotw/vpsllvw, или же vpshufbitqmb, или же vpermb,... Куча возможных вариантов.

Как транспонировать биты числа максимально быстро?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт