Perl как ускорить работу скрипта?

Question

Сергей @Yestestvenno

Системный администратор

Perl как ускорить работу скрипта?

Нужно сравнить каждий елемент первого масива с каждым елементом второго и вывести на печать уникальные и не уникальные значения в разные файлы

#!/usr/bin/perl
.....
foreach $nn (@array0) {
$g=0;
foreach $mm (@array1) {
if ($nn==$mm) {
$g=$g+1
print FILE1 "$nn\n";
}
}
if ($g==0) {
print FILE2 "$nn\n";
}
}
.......
Как ускорить работу скрипта? обработка 10 000 х 1 000 000 = 10мин
а нужно сравнить примерно 1 000 000 000 х 1 000 000 000 000...... подскажите подход

Если использовать for то 10 000 х 1 000 000 = 37 мин

Уточняю
Сравнение не сильно замедляет.....
я запустил вот такую программу без сравнения:
foreach $nn (@array0) {
foreach $mm (@array1) {
$g=$g+1
}
}
в итоге время работы почти 10 мин
как можна сравнить значения по другому, не через foreach или for?

Вопрос задан более трёх лет назад
448 просмотров

6 комментариев

Подписаться 2 Оценить 6 комментариев

Помогут разобраться в теме Все курсы

Нетология

Специалист по информационной безопасности + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Решения вопроса 2

1 комментарий

4 комментария

Сергей @Yestestvenno Автор вопроса

Дело в том что сравнение не сильно замедляет.....
я запустил вот такую программу без сравнения:
foreach $nn (@array0) {
foreach $mm (@array1) {
$g=$g+1
}
}
в итоге время работы почти 10 мин

Написано более трёх лет назад
Сергей @Yestestvenno Автор вопроса

как можна сравнить значения по другому, не через foreach или for?

Написано более трёх лет назад
vaut @vaut

Сергей: сложность вашего решения n*m. Как не крутись на миллионе вашем количестве будет тормозить.

Вам нужно один из списков хранить в структуре с быстрым доступом и проверять вхождение в неё элементов из большего списка. Для начала попробуйте хеши встроенные в перл.

Написано более трёх лет назад
vaut @vaut

Сергей: я предлагаю что то вроде этого:
foreach ( $nn (@array0) ) { $nn{$nn} = true }
foreach ( $mm (@array1) ) {
if ( exists $nn{$mm} ) {
print FILE1 "$mm\n";
delete $nn{$mm};
}
else print FILE2 "$mm\n";
}
while ( ( $key, $value ) = each %nn ) {
print FILE2 "$key\n";
}

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Тестирование ПО

+1 ещё

Простой
Уходить из тестирования или есть смысл поиска работы в 2026 году? С учетом, что мануал?
- 1 подписчик
- 16 июн.
- 335 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 554 просмотра
2

ответа
Автоматизация

Средний
Добавление Distr в образ Windows?
- 2 подписчика
- 26 мая
- 356 просмотров
2

ответа
Windows

+2 ещё

Средний
Дублирование действий на клавиатуре и мышке во всех окнах?
- 1 подписчик
- 30 апр.
- 423 просмотра
1

ответ
Автоматизация

Простой
Как настроить автоматизацию действий в игре майнкрафт в программе HETIC X1000?
- 1 подписчик
- 11 мар.
- 248 просмотров
1

ответ
Тестирование ПО

+1 ещё

Простой
Почему не нажимается кнопка по методу click() в Selenide?
- 1 подписчик
- 04 февр.
- 130 просмотров
0

ответов
ВКонтакте

+1 ещё

Простой
Как лучше организовать автопостинг ВКонтакте?
- 2 подписчика
- 21 янв.
- 471 просмотр
2

ответа
Python

+2 ещё

Простой
Программа для работы с выдачей заказов Wildberries «WB PVZ» не касаемо её самой, возможно упростить?
- 1 подписчик
- 16 янв.
- 649 просмотров
2

ответа
Автоматизация

Простой
Не последовательное выполнение нод в n8n. Почему?
- 1 подписчик
- 08 дек. 2025
- 157 просмотров
1

ответ
Автоматизация

+1 ещё

Простой
Как настроить термостаты теплого пола и радиаторные головки в одной комнате в системе Tuya?
- 1 подписчик
- 09 нояб. 2025
- 237 просмотров
1

ответ
Показать ещё Загружается…

какие значения в массивах, есть ли повторяющиеся значения?
Вопрос по примеру:
$nn==$mm Это точно то что вы хотите?
perldoc.perl.org/perlop.html#Equality-Operators
Shetani: пример "1079123123451", есть повторения
vaut: в этой задачи просто числа, но если использовать не числа, то я так понимаю оператор == не подходит?
Сергей: да верно, для сравнивания строк нужно использовать "eq"

Answer 1 · 2015-11-17 11:15:32

Можно воспользоваться готовым модулем:
search.cpan.org/~zmij/Array-Utils-0.5/Utils.pm
Модуль быстрый.
Примерно так.
Есть два массива. Сравниваем их и выводим уникальные значения:

my @a = qw( a b c d );
my @b = qw( c d e f );
my @c = array_diff( @a, @b );
say for (@c)

Результат:

a
b
e
f

Теперь находим элементы не уникальные.

use feature 'say';
use Array::Utils qw(:all);


my @a = qw( a b c d );
my @b = qw( c d e f );
my @c = intersect( @a, @b );
say for (@c)

Результат

c
d

Answer 2 · 2015-11-16 19:34:13

Совет дилетанта:
Меньшим списком заполняем хеш, и в один проход и большого получаем уников и дубли.
Забираем дубли в новый хеш и из меньшего списка получаем уников.
На небольших числах должно летать, упадет ли производительность на 10^6 записей не знаю.
Если будет падать меньший список нужно будет порезать на несколько.

Answer 3 · 2015-11-26 10:07:43

1. Простые и быстрые алгоритмы есть в Perl Cookbook
2. Массивы размером миллиард и триллион элементов так не сравнить - памяти просто не хватит.
3. Какой тип данных? Понятно что в Perl это вроде не так важно, но для решения задачи значение имеет.

Навскидку решение:
Допустим что у нас только целые числа - значения от 0 до 65535. Построим битовую маску имеющихся в массиве чисел, причем если число есть - соответствующий ему бит выставим в 1. Размер маски очевидно 65536 бит или 8192 байта, что совсем и не много.
Итак, идем по первому массиву и заполняем маску.
Теперь идем по второму массиву и если бит в маске для текущего числа выставлен в 1, то число не уникально.

Perl как ускорить работу скрипта?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт