Как оптимизировать алгоритм подсчёта остатка на складе по системе LIFO (последний пришел первый ушел)?

Question

Кирилл Петров @Recosh

Программист студент

Как оптимизировать алгоритм подсчёта остатка на складе по системе LIFO (последний пришел первый ушел)?

Приветствую! Сделал простенький алгоритм, который работает как надо, но жутко тормозит, если в него закинуть больше 500 позиций, а планируется ещё больше.
Для простоты возьмём минимальный набор исходных данных: цена, количество, операция (приход/уход)

К примеру возьмём такую таблицу:

Код генерации Python

df = pd.DataFrame({'price': [9.8, 9.78, 9.81, 9.76, 9.78, 9.65,], 'quantity': [3,4,5,6,1,4], 'operation': ['in','in','out','in','out','in']})

	price	quantity	operation
0	9.80	3	in
1	9.78	4	in
2	9.81	5	out
3	9.76	6	in
4	9.78	1	out
5	9.65	4	in

И вот после обработки этих данных по LIFO (последний пришел первый ушел) получаю таблицу с остатками:

Медленная функция на Python

def getOstatokLIFO(df):
    try:
        df2 = df.copy()
        df2.loc[df2.operation == 'out', 'quantity'] = -df2.quantity
        df2['needRM'] = False

        for i in df2.index:
            row = df2.iloc[i].copy()
            if row.quantity < 0:
                k = i
                row.needRM = True
                df2.iloc[i] = row
                quantitySell = row.quantity * -1

                while quantitySell > 0:
                    k -= 1
                    if k < 0:
                        break
                    rowBack = df2.iloc[k].copy()
                    if rowBack.quantity < 0:
                        continue
                    quantitySell = rowBack.quantity - quantitySell
                    if quantitySell > 0:
                        rowBack.quantity = quantitySell
                        df2.iloc[k] = rowBack
                        break
                    elif quantitySell < 0:
                        rowBack.quantity = 0
                        rowBack.needRM = True
                        df2.iloc[k] = rowBack
                        quantitySell = quantitySell * -1
                    else:
                        rowBack.quantity = 0
                        rowBack.needRM = True
                        df2.iloc[k] = rowBack
                        break

        return df2[df2.needRM == False][['price', 'quantity', 'operation']].copy()
    except Exception as e:
        raise e

	price	quantity	operation
0	9.80	2	in
3	9.76	5	in
5	9.65	4	in

И всё работает хорошо, но медленно... Подскажите как оптимизировать и в идеале переписать на нативные методы Pandas или векторами. Или даже можно на другом языке, если это не будет тормозить...

P.S. Пример в google colab для удобства

Вопрос задан более трёх лет назад
153 просмотра

Комментировать

Подписаться 1 Средний Комментировать

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

4 комментария

Кирилл Петров @Recosh Автор вопроса

Благодарю за ответ. Но идентификаторов нету, всё в перемешку в данный момент. За секуду может прийти от 20 до 1000 новых позиций. И требуется в идеале расчёт в реалтайме. Способ с сохранением остатоков уже сделан...

Ну и в данном варианте всё правильно работает) Вопрос только в скорости...

Написано более трёх лет назад
ComodoHacker @ComodoHacker

Кирилл Петров, Если у вас есть идентификаторы партий и вы можете получить остатки по ним, то вы просто упорядочиваете их нужным образом и за один проход в цикле списываете. Должно быть быстро.

Написано более трёх лет назад
Кирилл Петров @Recosh Автор вопроса

ComodoHacker, к сожалению идентификаторов нет. Но если их даже сделать (придумать самому) при уходе со склада одной операцией большого количества, а партия уже закончилась, придётся брать часть из другой партии, а это дробить операцию... Не, в данной задаче, как мне кажется, это избыточная информация.

Написано более трёх лет назад
ComodoHacker @ComodoHacker

Кирилл Петров, В этом "дроблении" и есть смысл LIFO. Вы, похоже, задачу плохо понимаете.
Ну или я не понимаю вашу задачу. :)

В любом случае, если у вас действительно может быть 1000 операций в секунду, вам нужен человек с опытом и в теме. С помощью Хабра вы эту задачу не решите.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Существуют ли сервисы: онлайн python editor для совместного использования?
- 1 подписчик
- вчера
- 86 просмотров
2

ответа
Python

Простой
На каком языке пишут описание функций в Python?
- 1 подписчик
- 26 сент.
- 268 просмотров
3

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 236 просмотров
1

ответ
Python

Простой
Как парсить pdf-ки с вк с помощью Python?
- 1 подписчик
- 16 сент.
- 324 просмотра
1

ответ
Python

+1 ещё

Простой
Почему возникает синтаксическая ошибка: invalid decimal literal?
- 1 подписчик
- 15 сент.
- 171 просмотр
2

ответа
Python

+1 ещё

Простой
Почему модель обнаружения объектов YOLO работает медленно?
- 1 подписчик
- 14 сент.
- 192 просмотра
1

ответ
Python

Простой
Что можно улучшить или оптимизировать в коде, чтобы он не был таким длинным?
- 2 подписчика
- 10 сент.
- 438 просмотров
4

ответа
Python

+3 ещё

Простой
Есть решение сборки Python в Exe с библиотекой Opencv?
- 1 подписчик
- 09 сент.
- 170 просмотров
0

ответов
Python

Простой
Как получить из URL имя страницы?
- 1 подписчик
- 08 сент.
- 199 просмотров
2

ответа
Python

+1 ещё

Простой
Почему у Python проблемы с форматированием?
- 1 подписчик
- 08 сент.
- 231 просмотр
1

ответ
Показать ещё Загружается…

Python developer

Digital Clouds

от 160 000 ₽

Python разработчик

Selecty

от 280 000 до 380 000 ₽

Python разработчик

ITK academy • Казань

от 75 000 ₽

Answer 1 · 2021-05-06 18:05:25

Надо сделать по нормальному, без таблиц, с использованием стека, который можно сделать просто тупо списком.

Обрабатывайте все записи в хронологическом порядке.

При приходе in, вы добавляете в стек (через append у list-а) пару (цена, количество).

При приходе out, вы берете из стека с верхушки записи, пока не наберете нужное количество и уменьшаете количество. В конце пеобразуйте список в таблицу, если надо.

Что-то вроде такого (сам не питонист, возможно придется переписать немного)

def getOstatokLIFO(df):
  stack = [];
  for index, row in df.iterrows():
    if row.operation == "in":
      stack.append([row.price, row.quantity])
      continue
    left = row.quantity
    while left > 0:
      if left >= stack[-1][1]:
        left -= stack[-1][1]
        stack.pop()
      else:
        stack[-1][1] -= left
        left = 0
        
  return stack

Но вообще, DataFrame очень медленно работет при такой последовательной обработке, поэтому я бы посоветовал вам не создавать pandas dataframe изначально, и получить ваши данные в виде списка словарей, touples или объектов. А алгоритм расчета предполагает последовательную обработку.

Answer 2 · 2021-05-06 09:22:21

Я не настолько силен в Питоне, чтобы понять ваш алгоритм. Но, по-моему, в ваших данных не хватает идентификатора партии. Без него не получится правильно реализовать LIFO (или FIFO). Вы ведь должны списывать с конкретных партий, и именно по той цене, по которой эта партия пришла.

Для ускорения же стандартный подход — хранить остатки на определенные моменты, а не пересчитывать их каждый раз все заново.

Как оптимизировать алгоритм подсчёта остатка на складе по системе LIFO (последний пришел первый ушел)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт