Как оптимизировать данный код, для меньшего потребление ресурсов системы?

Question

stayHARD @stayHARD

Как оптимизировать данный код, для меньшего потребление ресурсов системы?

import asyncio
import time
from concurrent.futures import ProcessPoolExecutor
from grab import Grab
import random
import psycopg2

# Open connection to the database
connection = psycopg2.connect(database="<....>",
                              user="<....>",
                              password="<....>",
                              host="127.0.0.1",
                              port="5432")

# Create a new cursor for it
c = connection.cursor()

# Select settings from database
c.execute("SELECT * FROM <....> WHERE id=1;")
data = c.fetchall()

# Get time starting script
start_time = time.time()

def operation(link):
    # open a new connection to the database
    conn = psycopg2.connect(database="<....>",
                                user="<....>",
                                password="<....>",
                                host="127.0.0.1",
                                port="5432")
    curs = conn.cursor()
    # init grab framework
    g = Grab()
    # try to find some elements on the page
    try:
        # open link
        g.go(link)
    except:
        pass
    conn.close()


@asyncio.coroutine
def main(item):
    yield from loop.run_in_executor(p, operation, item)

# Create async loop, declare number of threads
loop = asyncio.get_event_loop()
p = ProcessPoolExecutor(data[0][13])  # =200

# Init tasks list - empty
tasks = []

# Select all urls which need to process
c.execute ("SELECT url FROM <....> ORDER BY id;")

# Forming tasks
for item in c.fetchall():
    tasks.append(main(item[0]))

# Close main connection to the database
connection.close()
# Run async tasks
loop.run_until_complete(asyncio.wait(tasks))
# Get script finish time
print("--- %s seconds ---" % (time.time() - start_time))

Собственно вопрос в названии топика. Уже не знаю что сделать для оптимизации (4 gb RAM загруженны до предела, CPU - 90%+). Сервер просто ложится от такой нагрузки. Что можно предпринять?

Вопрос задан более трёх лет назад
528 просмотров

1 комментарий

Подписаться 4 Оценить 1 комментарий

Пригласить эксперта

Ответы на вопрос 3

1 комментарий

3 комментария

stayHARD @stayHARD Автор вопроса

Понял, попробую. Разве такая нагрузка может быть только от подключений к БД?

Написано более трёх лет назад
Roman K @deliro

stayHARD: Может и не только. Но начать стоит.

Написано более трёх лет назад

stayHARD @stayHARD Автор вопроса

Roman Kitaev: кол-во коннекшенов к базе ограничил одним, CPU в порядке. Ловлю вот такую ошибку теперь:

concurrent.futures.process.BrokenProcessPool: A process in the process pool was terminated abruptly while the future was running or pending.
Task exception was never retrieved
future: <Task finished coro=<main() done, defined at async.py:173> exception=BrokenProcessPool('A process in the process pool was terminated abruptly while the future was running or pending.',)>

Написано более трёх лет назад

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

+2 ещё

Простой
Можно ли использовать не парные Acquire/Release порядки памяти?
- 1 подписчик
- 17 часов назад
- 89 просмотров
2

ответа
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- нет подписчиков
- 23 часа назад
- 91 просмотр
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- вчера
- 100 просмотров
1

ответ
Python

Простой
Что можно ускорить в коде решателя игры крестики нолики?
- 1 подписчик
- вчера
- 153 просмотра
0

ответов
Python

Простой
Как подключиться по SMTP к Reg ru?
- 1 подписчик
- вчера
- 131 просмотр
0

ответов
Python

+1 ещё

Простой
Как имитировать нажатие пкм в неактивное окно DirectX?
- 1 подписчик
- 15 авг.
- 42 просмотра
1

ответ
Python

+1 ещё

Простой
Как настроить группы при создании нового пользователя в битриксе?
- 1 подписчик
- 14 авг.
- 112 просмотров
0

ответов
Python

+1 ещё

Простой
При добавления строчки @commands.has_permissions в терминале при запуске выдает ошибку?
- 1 подписчик
- 14 авг.
- 89 просмотров
0

ответов
Python

+1 ещё

Простой
Можно ли отключить SSL сертификат при парсинге?
- 1 подписчик
- 13 авг.
- 129 просмотров
0

ответов
Python

Простой
Не работает код, что делать?
- 2 подписчика
- 10 авг.
- 2129 просмотров
4

ответа
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python-разработчик (Senior)

BCraft

от 3 500 до 4 500 $

4 Гб сам процесс парсера занимает или Postgresql большую часть съедает?
90% CPU грузит сам парсер? А Postgre CPU не грузит?

Answer 1 · 2015-10-30 20:48:06

Денис @Ayahuaska

Хочу знать всё.

Сколько ж там у вас соединений с БД происходит?

Ответ написан более трёх лет назад

1 комментарий

Answer 2 · 2015-10-30 21:07:25

Собери эти ошмётки в класс и запускай одно соединение.

Уже не знаю что сделать для оптимизации

Да тут, собственно, ничего и не оптимизировано.

Answer 3 · 2015-10-30 21:44:35

Не стоит запускать все таски одновременно, используйте какой-нибудь пул воркеров. Про соединения уже сказали.

P.S. случайно заметил, что вы даже импортируете ProcessPoolExecutor, но никак его не используете.

Как оптимизировать данный код, для меньшего потребление ресурсов системы?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт