Как в Python3 использовать вложенный список в multiprocessing?

Question

ARTIsshoque @ARTIsshoque

Как в Python3 использовать вложенный список в multiprocessing?

К примеру, у меня есть словарь:

D = {'x': [1, 2, 3], 'y': [4, 5, 6], 'z': [7, 8, 9]}

и я хочу обработать его, используя несколько процессов. Для упрощения примера, пусть нужно просто умножить каждый элемент списков на 10 (хотя в реальности будет использоваться более сложная функция, для которой мультипроцессинг целесообразен). Набросок кода такой:

import multiprocessing

PROCESSES = 4

class Worker(multiprocessing.Process):

    def __init__(self, work_queue):
        super().__init__()
        self.work_queue = work_queue

    def run(self):
        while True:
            try:
                key, index = self.work_queue.get()
                self.process(key, index)
            finally:
                self.work_queue.task_done()

    def process(self, key, index):
        D[key][index] = D[key][index] * 10
        # Здесь написана полная ерунда, но я просто хочу показать, что мне нужно получить


def main():
    work_queue = multiprocessing.JoinableQueue()
    for i in range(PROCESSES):
        worker = Worker(work_queue)
        worker.daemon = True
        worker.start()
    for key, value in D.items():
        for i in range(len(value)):
            work_queue.put((key, i))
    work_queue.join()

main()

Проблема в том, что я не представляю, как можно передать очереди словарь со вложенными списками, так чтобы отдельные процессы могли сохранять результаты своих вычислений в этот словарь. Если использую Manager().dict(), то простые значения (строки, числа) сохраняются, а списки - нет.
Прошу помочь разобраться с этим вопросом.

Вопрос задан более трёх лет назад
334 просмотра

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее

Решения вопроса 1

7 комментариев

ARTIsshoque @ARTIsshoque Автор вопроса

Это хорошо, но в вашем примере между процессами делится словарь, а список целиком обрабатывается в одном процессе. Это немного не то, что нужно.

Написано более трёх лет назад
Roman K @deliro

ARTIsshoque, он не делится. В процессы передаются пары ключ-значение. Условие передачи одно - структура должна уметь pickle.dump

Написано более трёх лет назад
Roman K @deliro

ARTIsshoque, можешь засунуть словарь в __main__ и убедиться сам

Написано более трёх лет назад
ARTIsshoque @ARTIsshoque Автор вопроса

Pavel Denisov, в приведённом примере я сильно упростил задачу. На самом деле процессу нужен и ключ словаря, и индекс списка. То есть, значение получается не просто умножением 1, 2, 3 на 10, а 'x' в этом тоже участвует. Другими словами, мне нужен аналог D[key][index] = func(key, D[key][index]), разделённый на процессы. И списки могут состоять не из трёх элементов, поэтому я не могу представить, как эту структуру привести к одному списку.

Написано более трёх лет назад
ARTIsshoque @ARTIsshoque Автор вопроса

Pavel Denisov, думаю, стоит попробовать. Жаль, конечно, что нельзя использовать сложную структуру напрямую, но ваш вариант + Manager().list() - пока лучшее из всех возможных решений.

Написано более трёх лет назад
Roman K @deliro

Pavel Denisov, ну так это же не проблема. Нужно всего лишь переписать мой код под его нужды. Если ТС и этого делать не хочет — тут я бессилен.

Написано более трёх лет назад

ARTIsshoque @ARTIsshoque Автор вопроса

Roman Kitaev, получилось пока примерно так:

from concurrent.futures import ProcessPoolExecutor
from time import sleep


def process(arg):
    key, index, value = arg
    print("executing", key, value)
    sleep(1)
    return key, index, value * 10


if __name__ == "__main__":
    D = {'x': [1, 2, 3], 'y': [4, 5, 6], 'z': [7, 8, 9]}
    L = []
    for key, value in D.items():
        for index in range(len(value)):
            L.append((key, index, value[index]))
    with ProcessPoolExecutor(2) as executor:
        result = executor.map(process, L)
    for x, y, z in result:
        D[x][y] = z

    print(D)

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 192 просмотра
0

ответов
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 232 просмотра
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 151 просмотр
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 125 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 255 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 140 просмотров
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 141 просмотр
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 146 просмотров
0

ответов
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 262 просмотра
2

ответа
Python

Простой
Не могу разобраться почему не работает код python?
- 1 подписчик
- 22 окт.
- 430 просмотров
1

ответ
Показать ещё Загружается…

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Junior Python Developer

ITK academy • Воронеж

от 75 000 ₽

Может, стоит освежить свои знания о mutable?

Answer 1 · 2019-02-15 17:51:22

Не надо так низкоуровнево писать (обычно).

from concurrent.futures import ProcessPoolExecutor


D = {'x': [1, 2, 3], 'y': [4, 5, 6], 'z': [7, 8, 9]}


def process(arg):
    key, values = arg
    return key, [v * 10 for v in values]


if __name__ == "__main__":
    with ProcessPoolExecutor() as executor:
        result = executor.map(process, D.items())

    print(dict(result))

Чтобы убедиться, что оно действительно работает и не блокирует друг друга:

from concurrent.futures import ProcessPoolExecutor
from time import sleep


D = {'x': [1, 2, 3], 'y': [4, 5, 6], 'z': [7, 8, 9]}


def process(arg):
    key, values = arg
    print("executing", key, values)
    sleep(1)
    return key, [v * 10 for v in values]


if __name__ == "__main__":
    with ProcessPoolExecutor(2) as executor:
        result = executor.map(process, D.items())

    print(dict(result))

Как в Python3 использовать вложенный список в multiprocessing?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт