Как получать значения из потоков без использования future?

Question

Elnurhan @Elnurhan

Как получать значения из потоков без использования future?

Приветствую!
Я написал программу, которая считает суммарное количество слов в .log файлах в указанной директории в многопоточном режиме.
Первым аргументом в командной строке даётся путь к директории, в которой нужно искать .log файлы и считать слова в них.
Вторым аргументом даётся кол-во потоков.
Я написал следующий код для решения этой задачи

ThreadPool.h

#ifndef THREAD_POOL_H
#define THREAD_POOL_H

#include <boost/thread/condition_variable.hpp>
#include <boost/thread.hpp>

#include <future> // I don't how to work with boost future
#include <queue>
#include <vector>
#include <functional>

class ThreadPool
{
public:
    using Task = std::function<void()>; // Our task

    explicit ThreadPool(int num_threads)
    {
        start(num_threads);
    }

    ~ThreadPool()
    {
        stop();
    }

    template<class T>
    auto enqueue(T task)->std::future<decltype(task())>
    {
        // packaged_task wraps any Callable target
        auto wrapper = std::make_shared<std::packaged_task<decltype(task()) ()>>(std::move(task));

        {
            boost::unique_lock<boost::mutex> lock{ mutex_p };
            tasks_p.emplace([=] {
                (*wrapper)();
            });
        }

        event_p.notify_one();
        return wrapper->get_future();
    }

    //void enqueue(Task task)
    //{
    //  {
    //      boost::unique_lock<boost::mutex> lock { mutex_p };
    //      tasks_p.emplace(std::move(task));
    //      event_p.notify_one();
    //  }
    //}

private:
    std::vector<boost::thread> threads_p; // num of threads
    std::queue<Task>           tasks_p;   // Tasks to make
    boost::condition_variable  event_p; 
    boost::mutex               mutex_p;

    bool                       isStop = false;

    void start(int num_threads)
    {
        for (int i = 0; i < num_threads; ++i)
        {
            // Add to the end our thread
            threads_p.emplace_back([=] {
                while (true)
                {
                    // Task to do
                    Task task;

                    {
                        boost::unique_lock<boost::mutex> lock(mutex_p);

                        event_p.wait(lock, [=] { return isStop || !tasks_p.empty(); });

                        // If we make all tasks
                        if (isStop && tasks_p.empty())
                            break;

                        // Take new task from queue
                        task = std::move(tasks_p.front());
                        tasks_p.pop();
                    }

                    // Execute our task
                    task();
                }
            });
        }
    }

    void stop() noexcept
    {
        {
            boost::unique_lock<boost::mutex> lock(mutex_p);
            isStop = true;
            event_p.notify_all();
        }

        for (auto& thread : threads_p)
        {
            thread.join();
        }
    }
};

#endif

main.cpp

#include "ThreadPool.h"

#include <iostream>
#include <iomanip>
#include <Windows.h>

#include <vector>
#include <map>

#include <boost/filesystem.hpp>
#include <boost/thread.hpp>


namespace bfs = boost::filesystem;

int count_words(const std::string& filename)
{
    int counter = 0;
    std::ifstream file(filename);
    std::string buffer;
    while (file >> buffer)
    {
        ++counter;
    }
    
    return counter;
}

int main(int argc, const char* argv[])
{
    bfs::path path = argv[1];
    // If this path is exist and if this is dir
    if (bfs::exists(path) && bfs::is_directory(path))
    {
        // Number of threads. Default = 4
        int n = (argc == 3 ? atoi(argv[2]) : 4);
        ThreadPool pool(n);

        // Container to store all filenames and number of words inside them
        std::map<bfs::path, int> all_files_and_sums;
        
        // Iterate all files in dir
        for (auto& p : bfs::directory_iterator(path)) {
            // Takes only .txt files
            if (p.path().extension() == ".log") {
                // Future for taking value from here
                auto fut = pool.enqueue([&p, &all_files_and_sums]() {
                    // In this lambda function I count all words in file and return this value
                    int result = count_words(p.path().string());
                    std::cout << "TID " << GetCurrentThreadId() << "\n";
                    return result;
                });
                // "filename = words in this .txt file"
                all_files_and_sums[p.path()] = fut.get();
            }
        }

        int result = 0;

        for (auto& k : all_files_and_sums)
        {
            std::cout << k.first << "- " << k.second << "\n";
            result += k.second;
        }

        std::cout << "Result: " << result << "\n";
    }
    else
        std::perror("Dir is not exist");
}

Данное решение работает корректно. Но если в директории много .log файлов - программа работает медленно, а некоторые потоки (при большом кол-ве потоков) просто существуют и не делают ничего.
Я думаю, что проблема в future'ах. Как можно доставать значения из потоков без future?

Вопрос задан более трёх лет назад
210 просмотров

4 комментария

Подписаться 1 Средний 4 комментария

Евгений Шатунов @MarkusD Куратор тега C++

а некоторые потоки (при большом кол-ве потоков) просто существуют и не делают ничего.

Сколько точно потоков простаивают из скольки?
На каком CPU ты запускаешь свой код?

Написано более трёх лет назад
Elnurhan @Elnurhan Автор вопроса

Евгений Шатунов, Всегда по разному. Я создал 100 потоков потом посмотрел в Proccess Explorer'e и там первые 10-20 потоков всегда нагружены, а остальные - нет. Я думаю, что это потому что эти 10-20 потоков справляются и именно поэтому другие простаивают.
Процессор: Xeon e5430 (На другом тоже тестил - так же).

Написано более трёх лет назад
Евгений Шатунов @MarkusD Куратор тега C++

Elnurhan, ну давай немного проясним.
На борту у тебя Intel® Xeon® Processor E5430, на кристалле которого разведено 4 ядра без HT.

В самом буквальном смысле, это означает что без взаимных блокировок и группировки в очереди в твоем процессе сможет работать не больше четырех потоков.

Если ты сделаешь больше 4х потоков, то они начнут вытеснять друг друга с занимаемых ядер и уходить в ожидание исполнения. Таким образом производительность ты для себя только снижаешь.
А при большом увеличении количества потоков их часть и вовсе не сможет выбраться из очереди ожидания исполнения. Собственно, это то, что ты и наблюдаешь.

Тебе, опираясь на значение hardware_concurrency, стоит задавать не больше достаточного количества потоков в пуле, аффинировав[W][L] каждый поток конкретному ядру процессора, чтобы они не скакали, чтобы на ядрах не было переключения контекстов.
В этом, собственно, заключается базовая суть пула потоков.

Написано более трёх лет назад
Elnurhan @Elnurhan Автор вопроса

Евгений Шатунов, понял, спасибо.

Написано более трёх лет назад

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

+2 ещё

Простой
Можно ли использовать не парные Acquire/Release порядки памяти?
- 1 подписчик
- вчера
- 124 просмотра
2

ответа
C++

Простой
Сборник задач на C++?
- 1 подписчик
- вчера
- 77 просмотров
1

ответ
C++

Простой
Почему requires !std::is_void_v работает только для шаблона?
- 1 подписчик
- 15 авг.
- 47 просмотров
0

ответов
C++

Простой
Почему возникает ошибка C2512 в конструкторе с std::initializer_list?
- 1 подписчик
- 12 авг.
- 92 просмотра
1

ответ
C++

+1 ещё

Простой
Почему окружность получается отрисованной не ровно?
- 1 подписчик
- 11 авг.
- 169 просмотров
2

ответа
C++

Средний
Как инициализировать TCHAR*?
- 1 подписчик
- 08 авг.
- 83 просмотра
2

ответа
C#

+1 ещё

Средний
Где найти чистые исходники мобильного сервера SAMP / CRMP?
- 1 подписчик
- 06 авг.
- 144 просмотра
1

ответ
C++

+1 ещё

Сложный
Не работает поиск через Массив байтов, как исправить?
- 1 подписчик
- 03 авг.
- 114 просмотров
1

ответ
C++

Простой
Почему не получается вывести тип шаблона?
- 1 подписчик
- 02 авг.
- 67 просмотров
1

ответ
C++

Простой
Почему умные указатели нельзя интегрировать в язык?
- 1 подписчик
- 31 июл.
- 188 просмотров
3

ответа
Показать ещё Загружается…

QA Engineer

TRUCKER

от 85 000 до 100 000 ₽

Программист 1С

Косомсервис Управление • Санкт-Петербург

До 110 000 ₽

Frontend разработчик на React

SkillsRock • Таганрог

от 60 000 до 90 000 ₽

а некоторые потоки (при большом кол-ве потоков) просто существуют и не делают ничего.

Сколько точно потоков простаивают из скольки?
На каком CPU ты запускаешь свой код?
Евгений Шатунов, Всегда по разному. Я создал 100 потоков потом посмотрел в Proccess Explorer'e и там первые 10-20 потоков всегда нагружены, а остальные - нет. Я думаю, что это потому что эти 10-20 потоков справляются и именно поэтому другие простаивают.
Процессор: Xeon e5430 (На другом тоже тестил - так же).
Elnurhan, ну давай немного проясним.
На борту у тебя Intel® Xeon® Processor E5430, на кристалле которого разведено 4 ядра без HT.

В самом буквальном смысле, это означает что без взаимных блокировок и группировки в очереди в твоем процессе сможет работать не больше четырех потоков.

Если ты сделаешь больше 4х потоков, то они начнут вытеснять друг друга с занимаемых ядер и уходить в ожидание исполнения. Таким образом производительность ты для себя только снижаешь.
А при большом увеличении количества потоков их часть и вовсе не сможет выбраться из очереди ожидания исполнения. Собственно, это то, что ты и наблюдаешь.

Тебе, опираясь на значение hardware_concurrency, стоит задавать не больше достаточного количества потоков в пуле, аффинировав[W][L] каждый поток конкретному ядру процессора, чтобы они не скакали, чтобы на ядрах не было переключения контекстов.
В этом, собственно, заключается базовая суть пула потоков.

Answer 1 · 2020-08-19 09:47:39

Если почитать твой код внимательно, то становится видно немало проблем.

[&p, &all_files_and_sums]
Если с захватом all_files_and_sums по ссылке я не спорю, то точно ли p продолжит существовать после выхода из итерации? Давай подумаем. А после выхода из цикла продолжит?
У меня вообще нет уверенности в том, что после смещения bfs::directory_iterator адрес возвращаемого им bfs::directory_entry изменится. Я бы предпочел захватывать копию bfs::directory_entry в лямбде.

У тебя нет ожидания окончания работы от пула потоков - нет синхронизации с завершением запланированных задач. Точнее... ну как нет... У тебя жесткая синхронизация через std::future::get[?]. По факту в этот момент у тебя блокируется главный поток до момента обработки запланированной задачи. У тебя всегда планируется только одна задача. А видимость конкурентной работы создается лишь потому что какой поток ее схватил, тот и работает. Видимо задачи у тебя быстро обрабатываются, раз ты глазами этого не увидел.

Тебе стоит сохранять сами std::future от задач. В момент планирования их результат еще не определен и get вызывать не надо. Надо дождаться завершения работы всех потоков в пуле и исчерпания всех задач. Для этого у тебя в пуле должны быть продуманы механизмы оповещения.
После обработки всех задач ты можешь вызывать std::future::get, получать результаты и производить свои операции над ними.
Альтернативно, ты можешь более тонко реагировать на завершение каждой задачи и появление в ее std::future результата. Это тоже можно сделать. Просто сделать это надо своими руками и продумав масштабируемость такого механизма.

И в дополнение. Зачем тебе boost? Ты пользуешься std::future и лямбдами, ты пишешь в рамках стандарта C++11. Тебе доступны и std::thread, и все примитивы барьерирования из std.
В твоем распоряжении вся Thread Support Library. А boost тут явно лишний.
Если переключишься на C++17, то тебе и boost::filesystem не будет нужна, т.к. станет доступна std::filesystem - Filesystem Library.

Как получать значения из потоков без использования future?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт