Организация параллельных запросов

Question

Андрей @AndrewFoma

Организация параллельных запросов

Доброе время суток. Помогите пожалуйста с задачей. Условия такие:
1. Система «черный ящик» пишет в MS SQL Server данные, данных от 2 до 4 млн. записей ежедневно. Разработчики «черного ящика» предусмотрели, что сервис пишет каждый день в новую таблицу с именами: «table-2013-02-01», «table-2013-02-02», «table-2013-02-03»… и так далее.
2. Для поиска я написал простой скрипт в python с использование Pyodbc, в котором вводные данные: период с такого то числа, по такое, и что искать по какому полю. Сейчас скрипт выполняется в цикле (или с использованием «map») где в запросе меняется имя таблицы. А результаты добавляются в список.
3. Как мне в python распараллелить запрос, например, по 30 запросов за раз (к 30 таблицам) к базе?

P.S. В связи с малым опытом работы с Python, пытался использовать PP (Parallel Python), по аналогии:
f('name_table') — функция принимает имя таблицы, возвращает список.
period = ('table-2013-02-01','table-2013-02-02',...)
jobs = [job_server.submit(f,(input,), (,), («pyodbc»,)) for input in period]
for job in jobs:
job()
Но видимо использую не по месту, да и «вылавливаю» постоянно ошибку аля «unpickle»…

Вопрос задан более трёх лет назад
6099 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 3

Комментировать

3 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Ошибка IndexError: string index out of range в написании реализации системы Линденмайера – от чего происходит и как исправить?
- 1 подписчик
- 21 час назад
- 61 просмотр
1

ответ
Python

+1 ещё

Простой
Как сделать рассылку в viber в фоне?
- 1 подписчик
- 22 нояб.
- 87 просмотров
0

ответов
Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 223 просмотра
1

ответ
SQL

+2 ещё

Средний
Как правильно обрабатывать концевые пробелы в SQL Server и PostgreSQL?
- 2 подписчика
- 11 нояб.
- 190 просмотров
1

ответ
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 264 просмотра
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 167 просмотров
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 148 просмотров
1

ответ
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб.
- 185 просмотров
2

ответа
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 268 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 154 просмотра
0

ответов
Показать ещё Загружается…

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Answer 1 · 2013-02-17 16:34:23

gelas @gelas

А почему бы не переложить задачу на SQL Server сделав например union all 30-ти таблиц?

Ответ написан более трёх лет назад

2 комментария

Answer 2 · 2013-02-17 15:21:07

Если у вас большой простой по i/o, то наверное можно распараллелиться на обычных потоках

Answer 3 · 2013-02-17 15:25:42

Попробуйте присмотерться к библиотеке multiprocessing, я использую с python 2.7

from multiprocessing import Pool
import os

def main():
	pool = Pool(os.sysconf('SC_NPROCESSORS_ONLN'))
	result = pool.map(f, range(10))

def f(x):
	return x*x

почти стандартный пример.
Я похожим образом параллелю простые действия по ssh на разных машинах, когда нет доступа к puppet.
Правда, в вашем случае все может уперется в скорость чтения из одной базы, но несколько параллельных запросов должна держать…

Answer 4 · 2013-02-17 17:25:55

Я бы еще подумал о том, что старые закрытые по датам таблицы можно выносить в БД, например, на другой машине, и делать запросы там + основной сервер, если надо текущий день.

Организация параллельных запросов

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт