Как ускорить выполнение скрипта?

Question

Suxoi @Suxoi

PHP

Как ускорить выполнение скрипта?

Всем привет, никогда не сталкивался с выводом больших данных и их парсингом, только начинаю в программировании
Написал скрипт на php
Делаю запрос с выборкой данных из БД, с сохранением в массив(кстати тоже вопрос, если записей в таблице очень много больше 1 млн, правильно ли это?)

Дальше через foreach бегаю по массиву ищу поле и подставляю его в curl() запрос,чтобы спарсить данные, декодирую через json_decode, в этом массиве снова ищу данные foreach и обновляю в БД

Запустил скрипт за 15 мин , перемолол 4000 строк
В БД таких строк 1 620 000
Посчитал чтобы все их обработать займет 72 дня (по 4 сек на один запрос)

Как ускорить этот процесс и уменьшить время?Использовать потоки(А есть ли они в php)? Или использовать array_chunk и раскидывать по серверам?

const CHUNK = 100000;
const SERVER_NUM = 10;
$maxId = $db->fetchVal('SELECT o_id FROM organizations ORDER BY o_id DESC LIMIT 1');
$chunkOrder = 0;
$from = 0;
$to = CHUNK;
$SERVER_ID = 1;
  do{
     $chunkOrder++;
       if ($SERVER_ID !== $chunkOrder % SERVER_NUM){
           continue;
          };
   $org_twitter = $db->fetchAll('SELECT * FROM organizations where o_id >= :from and o_id < :to', ['from'=>$from, 'to'=> $to]);
   $from = $to;
   $to += CHUNK;
   foreach (){}
  }while($from <= $maxId)

Вопрос задан более трёх лет назад
394 просмотра

5 комментариев

Подписаться 1 Оценить 5 комментариев

Suxoi @Suxoi Автор вопроса

Есть несколько серверов поэтому решил разделить нагрузку между ними
Решение такое, в код дописал константы диапазона выборки (chunk_num), количество серверов, n-участок который молотит выделенный сервер (chunkOrder), начало выборки и конец, запехнул в цикл и делаю проверку ID сервер,чтобы ему было понятно какой участок брать и парсить
Теперь надо потестить, что скажите?
const CHUNK = 100000;
const SERVER_NUM = 10;
$maxId = $db->fetchVal('SELECT o_id FROM organizations ORDER BY o_id DESC LIMIT 1');
$chunkOrder = 0;
$from = 0;
$to = CHUNK;
$SERVER_ID = 1;
do{
$chunkOrder++;
if ($SERVER_ID !== $chunkOrder % SERVER_NUM){
continue;
};
$org_twitter = $db->fetchAll('SELECT * FROM organizations where o_id >= :from and o_id < :to', ['from'=>$from, 'to'=> $to]);
$from = $to;
$to += CHUNK;
foreach (){}
}while($from <= $maxId)

Написано более трёх лет назад
Suxoi @Suxoi Автор вопроса

Максим Тимофеев Андрей Minisol DevMan Что скажите? или использовать fork?

Написано более трёх лет назад
DevMan @DevMan

Suxoi: подсветка кода? не, не слышал.

Написано более трёх лет назад
Suxoi @Suxoi Автор вопроса

DevMan: Сорри, в комментах нельзя код подсвечивать

Написано более трёх лет назад
DevMan @DevMan

Suxoi: можно. только надо делать руками.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Skillbox

Веб-разработчик на PHP

9 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
OTUS

PHP Developer. Professional

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Простой
Как найти значение в ассоциативном массиве?
- 1 подписчик
- 6 часов назад
- 24 просмотра
1

ответ
PHP

+1 ещё

Простой
Как на PHP пушнуть в ассоциативный массив?
- 1 подписчик
- вчера
- 121 просмотр
1

ответ
PHP

Простой
Проблема с PDO LIKE?
- 1 подписчик
- вчера
- 126 просмотров
0

ответов
PHP

Простой
При попытке регистрации на сайте выдаёт ошибку A PHP Error was encountered. Что делать?
- 1 подписчик
- 03 дек.
- 113 просмотров
1

ответ
PHP

Простой
Как исправить include в php 8.3?
- 1 подписчик
- 02 дек.
- 252 просмотра
3

ответа
PHP

Простой
Ошибка в php, как исправить?
- 1 подписчик
- 29 нояб.
- 264 просмотра
2

ответа
PHP

+2 ещё

Простой
Как сконвертировать файл в формате excel в pdf?
- 4 подписчика
- 14 нояб.
- 421 просмотр
4

ответа
PHP

+1 ещё

Простой
Запрос на создание таблицы в clickhouse Yandex выдает ошибку 400 Bad Request, что не так с моим запросом?
- 1 подписчик
- 13 нояб.
- 249 просмотров
4

ответа
PHP

+2 ещё

Простой
Создание элемента с необычной формой и прозрачным фоном и рамкой?
- 1 подписчик
- 03 нояб.
- 217 просмотров
0

ответов
PHP

+3 ещё

Средний
Apache 2.4 и php 8.4 под windows. Почему не загружаются модули curl, openssl?
- 2 подписчика
- 01 нояб.
- 338 просмотров
3

ответа
Показать ещё Загружается…

PHP- разработчик (Symfony)

IT-Spirit • Москва

от 230 000 до 320 000 ₽

Fullstack-разработчик (PHP, Vue.js)

Qwintry

от 1 200 до 2 000 $

PHP dev (Symfony, RabbitMQ)

IT ATLAS • Москва

от 250 000 до 500 000 ₽

Есть несколько серверов поэтому решил разделить нагрузку между ними
Решение такое, в код дописал константы диапазона выборки (chunk_num), количество серверов, n-участок который молотит выделенный сервер (chunkOrder), начало выборки и конец, запехнул в цикл и делаю проверку ID сервер,чтобы ему было понятно какой участок брать и парсить
Теперь надо потестить, что скажите?
const CHUNK = 100000;
const SERVER_NUM = 10;
$maxId = $db->fetchVal('SELECT o_id FROM organizations ORDER BY o_id DESC LIMIT 1');
$chunkOrder = 0;
$from = 0;
$to = CHUNK;
$SERVER_ID = 1;
do{
$chunkOrder++;
if ($SERVER_ID !== $chunkOrder % SERVER_NUM){
continue;
};
$org_twitter = $db->fetchAll('SELECT * FROM organizations where o_id >= :from and o_id < :to', ['from'=>$from, 'to'=> $to]);
$from = $to;
$to += CHUNK;
foreach (){}
}while($from <= $maxId)
Максим Тимофеев Андрей Minisol DevMan Что скажите? или использовать fork?
Suxoi: подсветка кода? не, не слышал.
DevMan: Сорри, в комментах нельзя код подсвечивать
Suxoi: можно. только надо делать руками.

Answer 1 · 2016-09-20 12:49:47

Я думаю, что скрипт работает быстро, медленно работает CURL и возможно парсер, а это уже вопрос зависящий от Вашего кода и скорости работы второго сайта. А Вы о них забыли рассказать.
Думаю стоить вставить в код чекпоинты и выводить время, что бы понять где именно узкое место, потом выложить его код и попросить помочь с оптимизацией.

Answer 2 · 2016-09-20 12:53:59

nohup + порции на каждый инстанс скрипт в помощь
про nohup можно почитать тут: https://ru.wikipedia.org/wiki/Nohup

логика такая, будет два скрипта:
1) управляющий - создает инстанс скрипта, который должен получить выборку из бд и сделать запросы
2) скрипт, которые собственно делает выборку из бд и делает соответствующие запросы

ну я бы сделал например так

Как ускорить выполнение скрипта?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт