Как организовать многопоточную обработку массива в Perl?

Question

jslby @jslby

Как организовать многопоточную обработку массива в Perl?

Здравствуйте!
Уже не знаю где искать информацию. Решил изучить многопоточноть. До этого опыта ни на одном языке - не было.

Основная задача:
Брать массив элементов, скажем там 1000 элементов. Обрабатывать в определенное кол-во потоков.

Более подробно:
Есть файл со списком доменов. Я его открываю и преобразую каждую строку в элемент массива.
Есть функция-обработчик, которая заходит на данный домен и проверяет код ответа. Если ответ = 200, выводит его в консоль.
Не знаю как это всё раскидать по потокам, что бы скажем я поставил 10 потоков, и скрипт обрабатывал одновременно 10 доменов. Так же если один из доменов проверился раньше других - не ждать пока все домены проверятся, а сразу в данный поток отправлять новый домен. Вообщем нужно как-то отслеживать завершенные потоки и добавлять постоянно новые, что бы всегда работало ровно 10 потоков.

Если у кого ни будь есть пример, или скажем можете на коленке написать - буду признателен!

Вопрос задан более трёх лет назад
1091 просмотр

Комментировать

Подписаться 3 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 3

Комментировать

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C#

+1 ещё

Простой
Как использовать все потоки процессора при вычислении числа Фибоначчи в C#?
- 1 подписчик
- 25 янв.
- 161 просмотр
3

ответа
Windows

+1 ещё

Средний
Как скомпилировать код на perl в исполняемый файл на windows?
- 2 подписчика
- 12 янв.
- 128 просмотров
1

ответ
Многопоточность

+1 ещё

Простой
Как можно быстро ознакомиться с многопоточностью и ассинхронным программированием?
- 1 подписчик
- 28 дек. 2024
- 127 просмотров
1

ответ
Apache HTTP Server

+1 ещё

Простой
Как убрать запись Perl warnings в лог ошибок Apache?
- 1 подписчик
- 17 нояб. 2024
- 45 просмотров
1

ответ
Windows

+1 ещё

Простой
Где взять ActivePerl с модулями DBD::mysql и Geo::IP::PurePerl?
- 1 подписчик
- 13 нояб. 2024
- 73 просмотра
0

ответов
Windows

+3 ещё

Средний
На Windows 10 не работают cgi-скрипты?
- 1 подписчик
- 09 нояб. 2024
- 206 просмотров
1

ответ
Python

+3 ещё

Средний
Многопоточность в CPython. Как использовать PyInterpreterConfig_OWN_GIL при вызове Py_NewInterpreterFromConfig?
- 2 подписчика
- 15 авг. 2024
- 186 просмотров
1

ответ
Многопоточность

+1 ещё

Простой
Про асинхронность & многопоточность & мультипроцессинг в программировании?
- 1 подписчик
- 09 авг. 2024
- 172 просмотра
2

ответа
PowerShell

+1 ещё

Простой
Скрипт powershell использует слишком много памяти. Что я делаю не так?
- 1 подписчик
- 06 авг. 2024
- 402 просмотра
1

ответ
C++

+3 ещё

Средний
Реализация кэша для мульти поточного приложения?
- 1 подписчик
- 04 авг. 2024
- 176 просмотров
1

ответ
Показать ещё Загружается…

С/С++ Linux разработчик

Tempesta Technologies

До 8 000 $

С++ разработчик

НТЦ ПРОТЕЙ • Санкт-Петербург

от 150 000 до 300 000 ₽

Технический директор (CTO)

Intelinvest • Москва

от 200 000 ₽

Для сайта написать калькулятор расчета покупки товара

05 февр. 2025, в 15:21

7000 руб./за проект

Нарисовать пиксельного персонажа с анимациями

05 февр. 2025, в 15:13

2000 руб./за проект

Доработать поддержку DRM модуля

05 февр. 2025, в 15:02

1000 руб./в час

Answer 1 · 2015-07-27 10:06:56

Можете попробовать взять за основу вот такой код (с использованием Thread::Queue)

#!/usr/bin/perl

use strict;
use warnings;
use threads;
use Thread::Queue;
use Data::Dumper;

my @myarray = (1 .. 1000);
#print Dumper (\@myarray);die;

my $count = shift || 10;
print "Number of threads: $count\n";

my $q = Thread::Queue->new;
my @threads;
for (0 .. $count - 1)
{
    push @threads, async {
        while (defined (my $f = $q->dequeue))
        {
            some_process ($f);
        }
    };
}

for (@myarray)
{
    $q->enqueue ($_);
}

# Tell workers they are no longer needed.
$q->enqueue (undef) for @threads;

# Wait for workers to end
$_->join for @threads;

print "Complete\n";

1;

sub some_process
{
    my $element = shift;
    my $tid = threads->self->tid;
    #my $count = threads->list (threads::running);
    #print "Running threads: $count\n";
    print "Thread $tid started\n";
    open my $F, '>>', $tid . '.txt';
    print $F 'TID: ', $tid, ', element: ', $element, "\n";
    close $F;
    print "Thread $tid stopped\n";
}

Answer 2 · 2015-08-14 00:16:38

Создавать и убивать потоки, это плохая идея, нужно создавать потоки обрабатывающие массив в цикле, пока он не опустеет.
То есть массив используется как очередь.
Но потоки это беда, имхо.

#!/usr/bin/env perl

use strict;
use warnings;

use threads;
use threads::shared;

# Создаём расшареную переменную
my @numbers:shared = (1..100);

# Задаём количество потоков
my $threads = shift || 10;

# Создаём потоки и кладём их обекты в массив
my @threads;
for (1..$threads) {
    push @threads, threads->new(
        sub {
            while (@numbers) {
                # Достаём данные из массива
                # Предварительно заблокировава его для остальных потоков
                my $number;
                {
                    # Блокировка работает только в этом скоупе
                    lock(@numbers);
                    $number = shift(@numbers);
                }
                
                print 'Result: '.($number*10)."\n";
            }
        }
    );
}

# Запускаем потоки привязав их к основному процессу
$_->join for (@threads);

Answer 3 · 2015-07-26 20:31:46

Где-то видел пример в основе AnyEvent.

Проще не морочиться с многопоточностью, а использовать какой-нить брокер сообщений.
Будет большой задел на масштабируемость.

Как организовать многопоточную обработку массива в Perl?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт