• Как выводить ошибку если в тексте больше 3 слов?

    AlexNest
    @AlexNest Куратор тега Python
    Работаю с Python/Django
    Разделить строку по пробелам и посчитать количество элементов.
    В первом приближении это будет работать.
    Дальше разные плюшки вроде удаления пробелов по краям и т.д.
    Ответ написан
    Комментировать
  • Можете оценить код python?

    trapwalker
    @trapwalker Куратор тега Python
    Программист, энтузиаст
    Общепринятый ключ в такого рода утилитах для рекурсивной обработки подкаталогов -r/--recursive. Ваш вариант интуитивно не очень понятный.
    Сразу хочется придраться к наименованию основной функции и переменных. view_folder - подразумевает по смыслу некое неизменяющее воздействие, просмотр или что-то эдакое, но не то, что по факту делает её код. process_folder или clean_unpaired_raws подощло бы больше. А если добавить докстринг и тайпхинтинг для параметров, было бы вообще замечательно.
    И да, параметры следует тоже называть консистентно. У вас одно и то же называется в программе сильно по-разному. Зачем вносить неразбериху? Зачем экономить несколько символов в ущерб понятности и читабельности?
    Параметры следовало бы передавать по имени. Из-за неочевидного и неконсистентного именования приходится каждый раз смотреть что туда передаётся, причем внимательно следить, отсчитывая параметры позиционно и читать что про соответствующий параметр пишется в описании аргпарсера. Код должен быть максимально прозрачным даже для дго, кто первый раз его видит.

    Если уж вы запросили ревью, то буду цепляться по порядку без учета степени и значительности недочетов. Какие-то вещи вполне норм, но я бы сделал иначе, их тоже буду упоминать.
    Например, я бы в main передавал вектор аргументов с умолчанием в виде None. При передаче None доставал бы вектор из sys.argv[1:], как это делает парсер аргументов внутри, а при передаче конкретного вектора, использовал бы его. Это помогло бы протестировать парсинг параметров, если до таких автотестов дошли бы руки.

    То, что у вас в основной функции, принято называть спагетти-кодом. Следует разделять код на удобные для понимания и тестирования части.

    Я бы вынес в отдельную функцию формирование итератора по файлам.
    Отдельной безопасной функцией генерил бы дифф.
    Отдельно бы этот дифф применял. Отдельно (и опционально) спрашивал бы подтверждения пользователя.
    Часто от утилиты требуется "тихая" работа или работа без лишних вопросов к пользователю. Для этого даже применяются специальные ключи, вроде -y/--yes.

    Почему бы не импортнуть from pathlib import path вместо постоянного обращения pathlib.Path? Где-то экономите букву, а где-то вот так вот...

    Вот это условие:
    pathlib.Path(str(file.parent/file.stem) + img).is_file()

    Следовало бы записать так:
    file.with_suffix(img).exists()
    Это короче и правильнее. Есть нюанс. У вас с таким именем может быть не только файл, но и каталог. Об этом часто забывают. Я бы в таких неоднозначных ситуациях следовал более безопасному поведению, например сохранению рав-файла, если соответствующая картинка - не картинка, а вообще каталог.
    if 'raw_file' in str(file): #Если файл ранне был перемещен в папку raw_file его не игнорируем
        continue

    Игнорируете файлы в каталоге, заданном "магической константой". А если у пользователя такие каталоги используются для других целей?
    В идеале нужно хотя бы задекларировать такое поведение на уровне документации.
    Я бы ввёл перечень подкаталогов, которые игнорируются при сканировании. Позволил бы указывать название каталога, куда скидывать равы, в параметрах утилиты, добавлял бы это имя в список игнорируемых пол умолчанию каталогов.
    Позволил бы список игнорируемых каталогов изменять.

    Вы проверяете принадлежность фала подкаталогу проверкой вхождениея подстроки в его полное имя, но это неправильно, ведь такой кусок строки может быть в составе другого каталога или файла.
    Например в полном пути каталога, который нужно почистить будетет что-то вроде такого:
    "/home/dave/please_clean_raw_files_here/vacations2020/my_camera/IMG1010.RAW"
    Все равы в "/home/dave/please_clean_raw_files_here/vacations2020/my_camera/" будут проигнорированы.
    Неожиданно, правда?

    Ваша утилита будет работать гораздо быстрее, если сперва просканирует и запомнит все имена файлов, с которыми ей предстоит иметь дело, а потом будет оперировать ими в памяти.
    Часто JPG файлы чистят уже после того, как равы отложили в подкаталог или соседнюю папку.
    Ваша тулза умеет искать JPG только рядом с равом и грохнет все равы, для которых не найдёт JPGи, которые, впоне возможно, лежат в соседней папке. Вкупе с ключем рекурсивной обработки это может наделать бед внеся неразбериху и поудаляв нужные фотки.

    Часто у рав-файла и JPG одна и та же дата-время в свойствах файла или в exif. Это позволит навярняка удалять только гарантированно непарные файлы, и вы не зацепите случаи, когда у камеры сбросился или провернулся счетчик кадров. Также решится проблема с ситуацией, когда в одном каталоге есть фотосеты с разных камер, которыые именуют фотки аналогичным образом. Очень трудно совпасть по времени кадра до долей секунд.

    Вот в таких сучаях следует не следует инвертировать условие и углублять код, превращая его в спагетти:
    if not len(difference) == 0:
        folder = str()
        print('\nRaw without jpg:')
        for file in difference:
            if not folder == file.parent:
                folder = file.parent
                print(f'\nFolder: {folder}')
            print(f'- {file.name}')
    else:
        sys.exit(f'\nThere are no suitable files in the {path} folder\n')

    Смотрите, если по одной из веток происходит выход, то его нужно сделать сразу, чтобы не забивать голову лишними отступами и уровнями ветвления:
    if not difference:  # да в питоне так проверяют пустоту списка
            sys.exit(f'\nThere are no suitable files in the {path} folder\n')

    А ещё обратите внимание, что '\nRaw without jpg:' выведется даже если ключи заставляют утилиту удалить все равы, даже те, к которым есть парные картинки. То есть ваша тулза откровенно врёт пользователю в некоторых ситуациях.

    Вот здесь вы фактически группируете файлы по каталогам:
    for file in difference:
        if not folder == file.parent:
            folder = file.parent
             print(f'\nFolder: {folder}')
        print(f'- {file.name}')

    Отчего бы не вынести это в отдельную функцию, чтобы не захламлять код?
    Да, она использовалась бы лишь единожды, но будучи понятно названной и понятно задокументированной эта функция сделает ваш код гораздо прозрачнее. Её вызов будет нести понятные последствия, а из спагетти-кода главной функции уйдёт приличный кусок, он будет заменен одним вызовом.
    Обратите внимание на tertools.groupby. Она умеет группировать последовательность по результату лямбды и вы сможете сделать генератор генерторов, которые будут выдавать вам списки файлов по каталогам.

    Пчему бы не заменить все вот такие куски на отдельную функцию с булевским результатом?
    while True:
        confirm = input('\nMove this files to a folder "raw_files"? press: y/n: ')
    [...]

    Пусть мучает пользователя бесконечно, пусть сделает системный выход, если приспичит, а лучше вальнётся с исключением, чтобы можно было при ее применении освободить ресурсы по finally.
    Зато её вызов был бы простым и лаконичным:
    if confirm('\nMove this files to a folder "raw_files"? press: y/n: '):
        move_file(difference, difference_folder)
        sys.exit('Complete\n')


    Почему у вас функция move_file называется так, будто перемещает один файл, аргумент у нее наывается в единственном числе, а принимает она туа целый список путей?!!
    Это либо злонамеренность, либо халатность. Нельзя так относиться к коду. Вы его пишете и на ходу меняете не думая о названиях, не думая о документации, не думая о консистентности. Полагаю раньше эта функция отвечала за перемещение только одого файла, а потмо вы вспороли ей брюхо и заставили обрабатывать список, но не позаботились ни о правильном названии, ни об изоляции... Франкенштейн у вас получился.

    Дважды вычисляете одно и то же значение:
    if not pathlib.Path(file.parent / 'raw_files' / f'{p.stem}({i}){file.suffix}').is_file():
        pathlib.Path(file).replace(file.parent / 'raw_files' / f'{file.stem}({i}){file.suffix}')

    У вас тут и магическая константа в коде на каждом шагу, и неправильно импортированный pathlib... Cнова забыли, что помимо файлов бывают каталоги и каталог с определённым именем просто сломают логику вашей тулзы.
    Отсутствует корректная обработка ошибок. Открытый в каком-нибудь редакторе файл или папка с расширением .raw поломает к чертям всю работу и оставит её в некоторых случаях недоделанной, а это ещё хуже, чем вовсе не сделать ничего.

    Зачем вы каждый раз делаете приведение к Path?
    pathlib.Path(f / 'raw_files')
    Результат конкатенации с Path будет тоже Path. Нет смысла приводить тип? И так в куче мест по всему коду!

    Почему бы не сделать одну функцию по побработке одного единственного файла?
    def move_raw_file(file: Path, dest_folder: typing.Union[Path, str None]=None, exists='safe'):

    Переносит файл `file` в каталог dest_folder или удаляет, если он задан как None.
    dest_folder может быть задан абсолютно или относительно родительского каталога file.
    `exists`: safe, replace, ignore, error
    В общем всё плохо. Учиться и учиться. Но бывает и хуже. так что дерзайте.

    Для подобной утилиты ка кдля врача важно не навредить. Плохо будет, если вашу утилиту кто-то завернёт в GUI или засунет в пакетный файл научив неискушенного пользователя приводить в опрядок свою коллекцию фоточек одном кликом. В один прекрасный день с таким "качеством" написанная утилита перемешает фотки пользователя или, что хуже, удалит их часть.

    Нужно использовать исключения, причем так, чтобы код становился прозрачнее и было понятно что произойдёт в каких случаях.
    Нужно понимать как устроена файловая система и учитывать ее нюансы. Понимать, что файлы и папки - это немного разное, но они в едином пространстве имён. Понимать про абсолютные и относительные пути. Делать тулзы по умолчанию безопасными.
    Понимать, что файлы могут быть поименованы произвольно, а вашей тулзе могут дать пожевать корневой каталог. Надо, чтобы она не загадила винт подкаталогами и не перетащила равы куда не следует.
    Ответ написан
    5 комментариев
  • =: команда не найдена, что не так?

    Присваивание должно быть без пробелов
    Ответ написан
    Комментировать
  • Как сравнить местоположение слов в строке python?

    Dr_Elvis
    @Dr_Elvis Куратор тега Python
    В гугле забанен
    txt = "Next, use short sentences, because grandma, like anyone of us, if you make very long sentences, she gets to the end and she can't remember what you said in the beginning, anymore."
    try:
        A = txt.index("remember")
        B = txt.index("grandma")
        if int(A) - int(B) < 0:
            print('Слово A находится до слова B')
        else:
            print('Слово A находится после слова B')
    except ValueError:
        print('Не найдено как минимум одно из слов в строке')
    Ответ написан
    2 комментария
  • Как смотреть systemctl status в реальном времени?

    caramingo
    @caramingo
    админ из русского манчестера
    Можно запускать нужную команду каждые 2-3 секунды в watch
    watch -n2 systemctl status app.service
    Ответ написан
    Комментировать
  • Как смотреть systemctl status в реальном времени?

    @Zerg89
    Для всех остальных файлов есть команда tail с директивой f тоже выводит в реалтайме
    Ответ написан
    Комментировать
  • Что значит ошибка "IndentationError: unindent does not match any outer indentation level"?

    sergey-gornostaev
    @sergey-gornostaev Куратор тега Python
    Седой и строгий
    Значит, что у вас отступы в коде неправильные, и что поиском пользоваться вы не умеете.
    Ответ написан
    1 комментарий
  • В чем заключаются архитектурные ошибки моего кода?

    trapwalker
    @trapwalker Куратор тега Python
    Программист, энтузиаст
    class Calculation():
    
      def __init__(self, calculation):
        #init
        self.calculation = calculation

    Вы сделали класс `Вычисления`, чтобы проводить вычисления, пока проводятся вычисления вычислений над вычислениями, которые вычисляются как аргумент вычислений для вычисления состояния вычислений.

    Вы бы хотя бы в предметную область нас тут погрузили хоть немножечку. Не понятно же ничерта. Обычно класс и инстанс можно называть одинаково, за исключением первой буквы, но вы тут в аргументы что-то передаёте и то нифига не понятно. Делайте докстринги.

    Используйте тайпхинтинг, это позволяет не только статичесий анализ кода делать и избегать лишних ошибок, но, к тому же, это мощный инструмент документирования кода, неотрывно связанный с самим кодом. Это значит, что документация не отстанет от кода, а, напротив, будет за счет формализма и машиночитаемости помогать IDE помогать нам писать код. К тому же ряд вопросов отпадёт у тех, кто пытается читать код. Не нужно гадать на кофейной гуще что есть что.

    Нужно помнить, что исходный код пишется не для компьютеров, а для людей. Должно ыть удобно код писать, но любой код пишут только один раз, а вот читают его каждй раз, когда нужно разобраться что пошло не так, каждый раз, когда нужно расширить функциональность, исправить ошибки, изменить логику... Читабельность для кода гораздо важнее писабельности.

    У вас в коде полно "магических" констант. Именуйте их и выносите в начало модуля или, хотя бы, указывайте в инлайн-комментах единицы измерения для ясности. Не пренебрегайте свойствами, их можно документировать .

    Вы тут много работаете с календарными периодами. перебираете их с шагом... Это хорошее место для выделения функциональности в отдельную библиотеку, в отдельный тип данных. Возможно писать свой велосипед даже не придётся, ведь найдётся много готовых качественных протестированных библиотека для этих целей. Их будет легко и понятно инициализировать, у них будет простой, понятный и универсальный АПИ, они будут однотипно использованы в разных мемтах проекта, не придётся смешивать в одном контесте кучу переменных для обеспечения двух имплементаций одной и той же функциональности.
    Количество кода резко убавится, универсальный код будет вынесен в отдельный модуль и будет отдельно и полноценно протестирован, а в бизнес логике вы будете коротко и лаконично работать с абстракцией - понятной и простой.

    Вот тут у вас, очевидно, можно написать проще и без лишних повторений, провоцирующих ошибки:
    if i % self.inflation_indexation_period==0 and i != 0:
            if i not in range(0, self.inflation_indexation_period):
              init_indexation_inflation *= self.sales_init.inflation_indexation
            else:
              init_indexation_inflation = 1
            inflation_indexations.append(round(init_indexation_inflation, 5))
          else:
            inflation_indexations.append(round(init_indexation_inflation, 5))

    Лучше так:
    if i % self.inflation_indexation_period==0 and i != 0:
            if i in range(self.inflation_indexation_period):
              init_indexation_inflation = 1
            else:
              init_indexation_inflation *= self.sales_init.inflation_indexation
    
          inflation_indexations.append(round(init_indexation_inflation, 5))

    Функция get_inflation_indexations у вас имеет опасный побочный эффект. Она имеет префикс get_ но модифицирует контекст объекта. Это кэширование? Чем обусловлено такое поведение? Если такое делается "на всякий случай". то это плохая практика неявного внедрения побочного эффекта. Если нарочно, то такое надо документировать и корректно называть и описывать метод в докстринге.

    Опять же, get_inflation_indexations и get_value_indexations очень похожи по коду. Это повод вынести такую логику в отельную функцию, она будет проще и её будет проще тестировать!
    А у вас эти функции отличаются именами атрибутов внутри и магическими константами, которые в коде делать не хорошо, тем более без пояснений, тем более в кусках такого похожего кода.

    Перестаньте использовать i в качестве переменной для итерирования нетривиальных сущностей, отличных от протсого счетчика. i - это индекс. Используйте человеко-понятное название переменной для этого!

    Используйте декоратор итераторов enumerate. Это сделает код более прозрачным и читабельным, чем код с параллельными счетчиками. Увидев enumerate читатель кода сразу поймёт, что это простой счетчик итерируемых сущностей, что не нужно ожидать скачков этого счетчика и каких-то сложных корреляций.

    А вот здесь вообще всё плохо:
    count = 0
        revenue_list = []
        for i in total_price:
          revenue = i*total_value[count]
          revenue_list.append(revenue)
          count+=1

    count - это "количество", а вы его используете как "индекс" и никак иначе!
    i - это индекс, а вы туда суёте фактически цену!
    У вас total_price и total_value параллельные одноразмерные списки, их нужно состегнуть с помощью zip и пронумеровать с помощью enumerate (если надо, а здесь не надо!).
    Весь этот кусок понятнее, проще, короче и более питоничнее записать в такой форме:
    revenue_list = [price * value for price, value in zip(total_prices, total_values)]


    Итого вся вот эта громоздкая плохо читабельная функция:
    def get_revenue(self):
        '''Получить итоговую выручку'''
        total_price = []
        for i in self.get_inflation_indexations():
          price = self.sales_init.price*i
          total_price.append(price)
    
        total_value = []
        for i in self.get_value_indexations():
          value = self.sales_init.sales_volume*i
          total_value.append(value)
    
        count = 0
        revenue_list = []
        for i in total_price:
          revenue = i*total_value[count]
          revenue_list.append(revenue)
          count+=1
    
        return revenue_list

    Легко и читабельно для питониста заменяется на вот такую:
    def get_revenue(self):
        '''Получить итоговую выручку'''
        indexations = self.get_inflation_indexations()
    
        init_price = self.sales_init.price
        total_prices = [init_price * x for x in indexations]
    
        init_volume = self.sales_init.volume
        total_values = [init_volume * x for x in indexations]
    
        return [price * value for price, value in zip(total_prices, total_values)]


    И везде не стоит использовать параллельные счетчики, используйте итераторы, распаковку, зипы, енумервторы и функциональный стиль, ведь он сокращает код и делает его проще.

    Что это за ерунда:
    def get_interest_expenses(self):
        '''процентные расходы'''
        interest_expenses_list = []
        return interest_expenses_list


    Зачем много раз считать одно и то же целиком, чтобы взять только очередной кусочек из всего посчитанного?!
    Это вообще бред. Учитесь основам алгоритмизации и не надо программировать на питоне как не на питоне.

    Вот такое вообще жесть: self.get_revenue()[count]
    Отчего не сохранить в промежуточную переменную?!

    В общем, всё плохо.
    Если у вас есть функция, вычисляющая какой-то список, то зачем её вычислять каждый раз, когда вам нужен только один очередной элеиент этого списка, а вы перебираете его целиком?!
    И так много раз везде!
    Тут не архитектура хромает, тут основы алгоритмизации плачут. Тренируйтесь на кошках, сударь, больше решайте алгоритмических задачек. Структурируйте, декомпозируйте.

    Удачи.
    Ответ написан
    3 комментария
  • Классификация вопросов?

    @rPman
    самое простое - забить в программу все возможные варианты и проверять по условию

    причем буквально сравнением, удалив из строки с вопросом лишние символы (лишние пробелы, знаки препинания если конечно не дойдешь до фраз типа 'казнить нельзя помиловать' и т.п)

    правильное решение как ни странно существует, но оно не подъемно для задающих такие вопросы
    Ответ написан
    Комментировать
  • Можно ли в Linux делегировать права на создание пользователей?

    jamakasi666
    @jamakasi666 Куратор тега Linux
    Просто IT'шник.
    Можно добавить утилиту в sudoers, тогда он будет писать sudo useradd и пароль не надо будет вводить. Но тут уже вопрос безопасности, в такой ситуации пользователь сможет добавить пользователя с правами рута, перелогиниться в него и делать что хочет.
    Ответ написан
    Комментировать
  • Сколько нужно точек доступа Wi-Fi?

    Griboks
    @Griboks
    42
    Ответ написан
    Комментировать
  • Как сделать переадресацию в файле HOSTS не для всего IP, а для конкретной ссылки?

    @generalx
    Системный администратор
    Такое только веб-сервер может
    Ответ написан
    Комментировать
  • Как сделать переадресацию в файле HOSTS не для всего IP, а для конкретной ссылки?

    Rsa97
    @Rsa97
    Для правильного вопроса надо знать половину ответа
    Никак. Файл hosts - это часть подсистемы DNS. Он работает только с доменными именами, а не ссылками.
    Ответ написан
    Комментировать
  • Как захостить свой сайт на микротике?

    GavriKos
    @GavriKos
    Ох извращения....

    Ладно, давайте поэтапно.
    Если ваш "сайт" - это только картиночки-цеесесечки-хетемеельки - крч статика - то в теории микротик умеет хранить в себе файлы и даже отдавать их на сторону. Но там вроде и жуткие лимиты, и скорость низкая, и потанцевать с роутингом придется.
    Если нужна хоть какая то логика бекенда (БД, пхп, питон - вот это все) - то уже сложнее. Насколько я помню, у микротика есть такая штука как Metarouter - такой себе аналог виртуалки. В него можно запихнуть OpenWRT. А в OpenWRT уже можно запихнуть всякое типа апача и нджинкса. Так что В ТЕОРИИ вся эта кракозябра может и заработать. Только вот нафига....
    Ответ написан
    Комментировать
  • Как узнать онлайн на сервере в CS:GO с помощью Python?

    Vindicar
    @Vindicar
    RTFM!
    Гуглить пробовал?
    Вот кроме шуток, первый же запрос по "CS:GO query online python" меня отправил в доки к пакету python-valve.
    И там даже есть пример кода, которому нужно указать вместо ... адрес и порт, как я понимаю.
    import valve.source.a2s
    
    SERVER_ADDRESS = (..., ...)
    
    with valve.source.a2s.ServerQuerier(SERVER_ADDRESS) as server:
        info = server.info()
        players = server.players()
    
    print("{player_count}/{max_players} {server_name}".format(**info))
    for player in sorted(players["players"],
                         key=lambda p: p["score"], reverse=True):
        print("{score} {name}".format(**player))
    Ответ написан
    1 комментарий
  • Существует ли API для проверки работоспособности прокси сервера?

    seven5674
    @seven5674
    Старый я уже что бы что-то в себе менять
    ИМХО проверять надо не с внешнего сервера с машины на которой эти прокси будут использоваться
    потому как следующий вопрос будет - а почему там работает а у меня нет

    конечно же есть сервисы которые проверяют на доступность с разных точек но с учетом того что процентов 99% прокси не анонимные то есть большие шансы что прокси будут рабочими но не для тебя

    Простейшая реализация проверки выглядит так - делаешь N запросов на каждый прокси и смотришь допустимый процент статуса 200. Упростить задачу по скорости можно заменив get на head запросы

    Пример реализации на Qt + потоки
    628566675d6bf751250079.png
    Ответ написан
    Комментировать
  • Как настроить резервное копирование серверов?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Был в десятке разных компаний. У всех - по разному.
    Бэкап это по большей части организационный вопрос. Главное что в этом топике вам никто правильно не ответит.

    Нужно спрашивать ваш бизнес о требованиях к базе. Например:

    1) Как долго бизнес согласен ждать восстановления? Это влияет например на стратегию делания инкрементальных кумулятивных и полных бэкапов для БД. Разумеется все БД - в режиме arhivelog/wal.
    2) От чего мы страхуемся? От физических повреждений. Или еще нужно предохранится от неверно поставленного обновления на базу. Тут - надо прикупить дополнительных дисков или магнитных накопителей.

    Самое главное что у вас должны быть учебные тревоги. Тоесть вы должны реально откатать бэкап+восстановление хотя-бы несколько раз. Иначе то что вы делаете будет фейком. Часто видел такое. Бэкап делает какой-то сисадмин средствами Акрониса например. Но этот сисадмин и понятия не имеет как работает Oracle и что вообще нужно предварительно подготовить чтоб бэкапные файлы не стали ненужным балластом.
    Ответ написан
    Комментировать
  • Как настроить резервное копирование серверов?

    CityCat4
    @CityCat4
    //COPY01 EXEC PGM=IEBGENER
    У бэкапа нет понятия "правильно". У бэкапа есть понятие "решающее проблемы конкретного бизнеса". И стратегий, и тактик, и технологий тут хоть #опой ешь и все разные. К тому же грамотно организованный бэкап - это недешено.
    Ответ написан
    Комментировать