Надо в вопрос добавить хотя бы свою попытку в виде кода, пусть неудачную. Вы же как-то пробовали?
Иначе это не вопрос, а задание, см.п.5.12 Регламента.
AnilVia, вы неправильно ставите тэги. Python надо ставить, когда у вас суть проблемы в python, и вы приносите фрагмент кода python, в котором проблема. Простого упоминания Python не достаточно для публикации в этот тэг.
Soap тэг вообще никак не относится к парсингу, вы его ставите по ошибке.
Возможно, вы хотели поставить тэг beautiful soup, но его опять же имело смысл ставить только вместе с кодом, отображающим вашу попытку решения в вопросе.
Вы привели фрагмент кода html - тэг html уместен. Вы спрашиваете о парсинге - тэг парсинг уместен.
Алексей, вот если бы вы привели свой код на python, js или php, то можно было бы поставить соответствующие тэги. А простое упоминание не дает права писать в эти тэги. Прочтите еще раз Регламент.
Вадим, мне как-то хватало форматтера в pycharm ce.
Поставил black, посмотрел… не знаю. Он поправил лишь в одном месте мой код, разложив параметры конструктора построчно. Да, наверное, это было бы удобно, но всё происходит как-то неявно - оно срабатывает на триггер какой-то, не сразу и не вижу возможности понять, где и что оно поменяло.
Наверное, откажусь от него.
А что сильнее тормозит - получение файла с сервера или обработка файла?
Если получение, то хоть обвешайся процессорами, не ускоришь. Ускорить получение должен помочь асинхронный код.
Я бы попробовал разделить этапы получения и обработки. Асинхронно получать файлы и помещать их в очередь обработчика. Таким образом, обработчик будет лопатить очередь постоянно, не простаивая на ожидание каждого отдельного файла.
Как именно это практически реализовать всё, не знаю - я по стратегии :)
Не надо использовать имя list и другие названия встроенных типов python - это может привести к странным результатам. Если уж так хочется, пишите "my_list".
См.п.3.6 Надо поправить название.
См.п.3.2 - надо указать конкретный тэг твоей БД (SQLite), а не общий.
Если вы не будете следовать правилам ресурса, ваши вопросы могут быть удалены модератором, а в случае неоднократных нарушений аккаунт может быть удален временно или навсегда.