• Как максимально оградить данные от потери?

    byte916
    @byte916
    Всё зависит от бюджета и фантазии.
    Все эти флешки, внешние диски и прочее - это ручная работа, которую можно забыть, не успеть сделать, да и в целом надо помнить.

    Проще и дешевле всего (в плане денег и автоматизации) и достаточно надежно - завести отдельно стоящий компьютер с софтовым (mdadm) рейдом 6 (когда два диска могут вылететь и ничего не исчезнет). И иметь один запасной диск на случай вылета, чтобы сразу заменить. Систему тоже на отдельном рейде, можно на зеркальном. И не забыть загрузчик тоже отзеркалить.
    Второй уровень надеожности - добавить второй компьютер. Можно без рейда. Например, свой личный или опять же отдельно стоящий. И настроить автоматическую синхронизацию, например через Syncthing.
    Третий уровень - разнести компьютеры географически. Один дома, второй на работе. Или в дата центре. Или два в разных дата центрах.
    Ответ написан
    Комментировать
  • Какие модули есть в Python для целей анализа, форматирования, вывода текста?

    @shut0vby
    python, js, html&css
    Привет. Советую глянуть библиотеку ReportLab, создаёт pdf на основе данных, возможно это то что тебе нужно. Для поиска совпадений слов, знаков препинаний: модули re, collenctions, как-то так
    Ответ написан
    1 комментарий
  • Выбор: парсить на питоне с aiohttp, asyncio, bs4 или requests + bs4?

    Mike_Ro
    @Mike_Ro Куратор тега Python
    Python, JS, WordPress, SEO, Bots, Adversting
    Помогите разложить это по полочкам.

    Зависит от задачи:
    1. aiohttp + asyncio - выполнение асинхронных http запросов, без блокировки основного потока. Когда надо спарсить множество страниц без защиты, а времени в обрез.
    2. requests + bs - выполнение синхронных http запросов, с блокировкой основного потока. Когда надо спарсить несколько страниц без защиты, и время не жмет.
    3. selenium - когда первые 2 легли на первой же "защите на дурака". Синхронно, медленно, ресурсоёмко, максимальная человечность.
    Ответ написан
    6 комментариев