Как из длины массива и максимального количества потоков узнать индексы, которые будет обрабатывать поток?

Question

Catmengi @Catmengi

Зачем я это делаю? Просто потому что

Как из длины массива и максимального количества потоков узнать индексы, которые будет обрабатывать поток?

Есть длинна структуры данных и условный define D_STRUCT_SERIALISER_THREADS, каждый такой поток обрабатывает элемент из хэш таблицы который он получает по ключу из keys[i] и передает в очередь обработанный элемент откуда ее берет другой поток и собирает в финальный char* массив. Будет ли быстрее если запустить этап обработки элемент в несколько потоков? Поток сборки простаивает мало. Я понял что надо как-то посчитать start и end для массива keys для каждого потока, НО размер keys не всегда четный. Какие есть варианты решения этой проблемы? Целесообразно ли вообще делать сериализацию в несколько потоков? Код текущего сериализатора

Вопрос задан более года назад
389 просмотров

10 комментариев

Подписаться 2 Простой 10 комментариев

d'Ivan @2ord

длинны массива
длинна или длина?

максильного

Написано более года назад
Dmitry Bay @kawabanga

d'Ivan, тут ребята не только из РФ. Предлагаю не особо обращаться на это вниманНие.

Написано более года назад
Catmengi @Catmengi Автор вопроса

d'Ivan, 3 по русскому и писал в спешке))

Написано более года назад
res2001 @res2001

Catmengi,
Целесообразно ли вообще делать сериализацию в несколько потоков?

По моему, при сериализации/десериализации выигрыша от многопоточки будет не много, если он вообще будет, т.к. сами операции при сериализации/десериализации простые и достаточно быстрые, а синхронизация при многопоточке даст дополнительные накладные расходы, которые вполне вероятно перекроют выигрыш от параллельного выполнения сериализации/десериализации.
Чтоб это узнать нужно погонять тесты в обоих вариантах.
Возможен выигрышь только при достаточно большом количестве данных (миллионы на каждый поток) и грамотной синхронизации потоков, а лучше вообще избавиться от синхронизации, если это возможно.

Написано более года назад
Catmengi @Catmengi Автор вопроса

res2001, у меня примерно тоже самое и получилось на 3 поточной имплементации, я думал что это проблема имплементации, но видимо верну обратно однопоток(

Написано более года назад
res2001 @res2001

Catmengi, Это вполне может быть проблема имплементации. Т.к. синхронизация может стать узким местом во всей схеме.
Строго говоря, понять в чем затык, можно лишь на тестах, сравнивая производительность с "эталонной" однопоточной реализацией. Тесты гонять надо с разным количеством потоков и разным количеством данных на поток - при увеличении количества данных должны больше проявляться преимущества многопоточки.
Так же еще важный момент - как у вас происходит сбор сериализованных данных из разных потоков, в этом месте то же может быть "бутылочное горлышко", т.к. сбор, видимо, проходит в 1 потоке.

Написано более года назад
Catmengi @Catmengi Автор вопроса

res2001, я пытался решить проблему бутылочного горлышка в старом коде через несколько потоков сборщиков, которые выводили готовый массив char* и его длину и потом скармливал это в такой же сборщик но который использует массив вместо очереди( я не могу его использовать раньше потому что размер выходного буфера не известен, потому что не известен размер входных данных, поэтому используется realloc и семафор + очередь), сейчас я его переписываю и планирую использовать этот же подход или заменить очередь на массив указателей)

Написано более года назад
res2001 @res2001

Catmengi, Выделение памяти в этом процессе то же может съесть у вас всю производительность - это достаточно дорогая операция. Обычно в таких случаях берут буфер некоего максимального возможного размера (в разумных пределах конечно), буфер этот может быть статически выделен, и работают уже с ним, не выделяя память при сериализации.

Написано более года назад
Catmengi @Catmengi Автор вопроса

res2001, теперь появились проблемы с производительностью из-за pthread, по беглому гуглингу понял что нужно использовать thread pool, насколько я понял нужно чтобы он был глобальной переменной которая 1 раз инициализируется и в конце программы высвобождается иначе оно не даст особого буста производительности, верно? Но тут возникает проблема что место в пуле может закончится а поток будет ждать пока завершиться другой, еще не запущенный поток, который не может запуститься потому что нет места в пуле

Написано более года назад
res2001 @res2001

Catmengi, 1. Если у тебя в потоках кратковременные задачи, которые достаточно быстро завершаются и достаточно часто создаются, то да, смысл в пуле потоков есть. Иначе на создание уничтожение потока будет расходоваться слишком много ресурсов.
2. В любой системе всегда ограниченное количество вычислительных ядер, следовательно всегда и везде могут одновременно работать лишь ограниченное количество потоков, сколько бы их не стояло в очереди. Так что это абсолютно нормальная ситуация. Не делай в пуле потоков больше, чем ядер в системе - это обычно не дает дополнительного буста.

Написано более года назад

Помогут разобраться в теме Все курсы

Нетология

Разработчик на C++

12 месяцев

Далее
Академия Эдюсон

Разработчик игр на Unreal Engine + ИИ

9 месяцев

Далее
Stepik

Профессия: Разработчик C++ (Junior)

2 месяца

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C

+2 ещё

Сложный
Почему зависают прерывания клавиатуры (IRQ1) после первого нажатия при переходе на GOP в самописной ОС (x86_64)?
- 1 подписчик
- 15 часов назад
- 71 просмотр
0

ответов
C

+1 ещё

Средний
Как работает выравнивание памяти в С в структурах?
- 1 подписчик
- 07 июл.
- 115 просмотров
2

ответа
C

Средний
Почему при передаче указателя в функцию, функция получает копию?
- 1 подписчик
- 17 июн.
- 170 просмотров
4

ответа
C

Простой
Форк небольшой мат. библиотеки на Си, где искать исполнителей?
- 1 подписчик
- 04 мар.
- 296 просмотров
2

ответа
C

+1 ещё

Простой
Pthread, чистый си, откуда ошибка сегментирования?
- 1 подписчик
- 03 мар.
- 251 просмотр
2

ответа
C++

+2 ещё

Простой
Заголовочные файлы в Си нужны только для интерфейса?
- 3 подписчика
- 26 февр.
- 668 просмотров
5

ответов
C++

+1 ещё

Простой
Как найти причину недетерминизма программы?
- 1 подписчик
- 12 февр.
- 340 просмотров
4

ответа
C

+4 ещё

Средний
Почему прошивка для STM32F103 не запускается после перехода с Keil на Cmake?
- 2 подписчика
- 11 дек. 2025
- 288 просмотров
0

ответов
Debian

+1 ещё

Простой
Где OpenWatcom в Debian!?
- 1 подписчик
- 17 нояб. 2025
- 221 просмотр
1

ответ
C++

+1 ещё

Средний
Имя массива это адрес первого элемента или указатель на его первый элемент в Си?
- 2 подписчика
- 12 нояб. 2025
- 678 просмотров
5

ответов
Показать ещё Загружается…

длинны массива
длинна или длина?

максильного
d'Ivan, тут ребята не только из РФ. Предлагаю не особо обращаться на это вниманНие.
d'Ivan, 3 по русскому и писал в спешке))
Catmengi,
Целесообразно ли вообще делать сериализацию в несколько потоков?

По моему, при сериализации/десериализации выигрыша от многопоточки будет не много, если он вообще будет, т.к. сами операции при сериализации/десериализации простые и достаточно быстрые, а синхронизация при многопоточке даст дополнительные накладные расходы, которые вполне вероятно перекроют выигрыш от параллельного выполнения сериализации/десериализации.
Чтоб это узнать нужно погонять тесты в обоих вариантах.
Возможен выигрышь только при достаточно большом количестве данных (миллионы на каждый поток) и грамотной синхронизации потоков, а лучше вообще избавиться от синхронизации, если это возможно.
res2001, у меня примерно тоже самое и получилось на 3 поточной имплементации, я думал что это проблема имплементации, но видимо верну обратно однопоток(
Catmengi, Это вполне может быть проблема имплементации. Т.к. синхронизация может стать узким местом во всей схеме.
Строго говоря, понять в чем затык, можно лишь на тестах, сравнивая производительность с "эталонной" однопоточной реализацией. Тесты гонять надо с разным количеством потоков и разным количеством данных на поток - при увеличении количества данных должны больше проявляться преимущества многопоточки.
Так же еще важный момент - как у вас происходит сбор сериализованных данных из разных потоков, в этом месте то же может быть "бутылочное горлышко", т.к. сбор, видимо, проходит в 1 потоке.
res2001, я пытался решить проблему бутылочного горлышка в старом коде через несколько потоков сборщиков, которые выводили готовый массив char* и его длину и потом скармливал это в такой же сборщик но который использует массив вместо очереди( я не могу его использовать раньше потому что размер выходного буфера не известен, потому что не известен размер входных данных, поэтому используется realloc и семафор + очередь), сейчас я его переписываю и планирую использовать этот же подход или заменить очередь на массив указателей)
Catmengi, Выделение памяти в этом процессе то же может съесть у вас всю производительность - это достаточно дорогая операция. Обычно в таких случаях берут буфер некоего максимального возможного размера (в разумных пределах конечно), буфер этот может быть статически выделен, и работают уже с ним, не выделяя память при сериализации.
res2001, теперь появились проблемы с производительностью из-за pthread, по беглому гуглингу понял что нужно использовать thread pool, насколько я понял нужно чтобы он был глобальной переменной которая 1 раз инициализируется и в конце программы высвобождается иначе оно не даст особого буста производительности, верно? Но тут возникает проблема что место в пуле может закончится а поток будет ждать пока завершиться другой, еще не запущенный поток, который не может запуститься потому что нет места в пуле
Catmengi, 1. Если у тебя в потоках кратковременные задачи, которые достаточно быстро завершаются и достаточно часто создаются, то да, смысл в пуле потоков есть. Иначе на создание уничтожение потока будет расходоваться слишком много ресурсов.
2. В любой системе всегда ограниченное количество вычислительных ядер, следовательно всегда и везде могут одновременно работать лишь ограниченное количество потоков, сколько бы их не стояло в очереди. Так что это абсолютно нормальная ситуация. Не делай в пуле потоков больше, чем ядер в системе - это обычно не дает дополнительного буста.

Answer 1 · 2025-04-12 19:47:09

Вам надо разбить массив на K как можно более равных частей?

Если длина массива N, то все куски будут длиной хотя бы floor(N/K), и ровно N%K будут иметь на 1 элемент больше. Вроде, если у вас 10 элементов надо на 3 потока разделить, то будут длины {4, 3, 3}. А если 15 на 4, то {4, 4, 4, 3}

Так что i-ый кусок будет начинаться с позиции (N/K)*i + min(i, N%K) и иметь длину N/K + ((i < N%K) ? 1 : 0).

Чуть проще формулы, если вы эти позиции явно в массиве получите, а не будете каждую отдельно считать:

int start[K], end[K];
int prev = -1;
for (int i = 0; i < K; ++i) {
  int len = N/K + ((i < N%K) ? 1 : 0);
  start[i] = prev + 1;
  end[i] = start[i] + len;
  prev = end[i];
}

Как из длины массива и максимального количества потоков узнать индексы, которые будет обрабатывать поток?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт