Ответы пользователя по тегу Python
  • Как из этого класса достать строку?

    Viktor_T2
    @Viktor_T2
    python developer
    text = "<({'type': 'message_new', 'object': {'message': {'date': 1599285831, 'from_id': 35183475, 'id': 0, 'out': 0, 'peer_id': 2000000008, 'text': 'test', 'conversation_message_id': 90, 'fwd_messages': [], 'important': False, 'random_id': 0, 'attachments': [], 'is_hidden': False}, 'client_info': {'button_actions': ['text', 'vkpay', 'open_app', 'location', 'open_link'], 'keyboard': True, 'inline_keyboard': True, 'carousel': False, 'lang_id': 0}}, 'group_id': 0332911, 'event_id': '989337a2939a8ed1ed298be7409303069ab40958'})>"
    split1 = text.split(',')
    print(split1)
    for e in split1:
    split2 = (e.split(':'))
    print(split2)
    key = split2[0].strip().strip("'")
    print(key)
    if key == 'peer_id':
    print('BINGO!!!')
    value = split2[1].strip().strip("'")
    print('key = ', key, ', value =', value)

    print('------------------')
    print('key = ', key, ', value =', value)

    # Это если по-простому, по-тупому, без всяких регулярок. Комбинация strip и split
    Ответ написан
  • Как улучшить код получения текста с картинки?

    Viktor_T2
    @Viktor_T2
    python developer
    Предобработка изображений с CV очень важна.
    Есть много разных фокусов, вот например https://stackoverflow.com/questions/39233823/openc... ну и других много разных.
    Вот здесь пишут что качество распознавания зависит от ширины буквы в пикселях: https://groups.google.com/forum/#!msg/tesseract-oc...
    Это к вопросу о дпи.
    3. тесеракту можно передавать его тессерактовы параметры, например:
    conf = u"--psm 11"
    text = TS.image_to_string(Image.open('1111.jpg'), config=conf)
    psm - Режимы сегментации страницы:
    0 Только ориентация и обнаружение скриптом (OSD).
    1 Автоматическая сегментация страницы с OSD.
    2 Автоматическая сегментация страницы но без OSD или OCR.
    3 Полностью автоматическая сегментация страницы, но без OSD. (По умолчанию)
    4 Предполагается единичная колонка текста переменной длины.
    5 Предполагается единый унифицированный блок вертикально выравненного текста.
    6 Предполагается единый унифицированный блок текста.
    7 Обрабатывать изображение как единичную текстовую строку.
    8 Обрабатывать изображение как единичное слово.
    9 Обрабатывать изображение как единичное слово в круге.
    10 Обрабатывать изображение как единичный символ.
    11 Разреженный текст. Найти столько текста, сколько возможно без особого порядка.
    12 Разреженный текст с OSD.
    13 Сырая строка. Обрабатывать изображение как единичную текстовую строку, обход специфичных для Tesseract хаков.

    Идеально точного результата не будет никогда, только больше ошибок или меньше ошибок.
    Ответ написан
    Комментировать
  • Как привести документ к одному языку (раскладке)?

    Viktor_T2
    @Viktor_T2
    python developer
    Обрабатываете всё скопом в апперкейс/английская раскладка (тоесть меняете Н на H, А на A, ну и так далее ) и потом свое условие в скрипте тоже переводите в такойже вид апперкейс/английская раскладка. (Можно наоборот из латиницы в
    русский перекодировать в зависимости от преобладания рус./англ. языка) Будет все работать. Как-то так.
    Ответ написан
    Комментировать
  • Возможно ли загрузить аудио с ютуба с помощью питон скрипта в переменную, не записывая на жесткий диск (в webm)?

    Viktor_T2
    @Viktor_T2
    python developer
    import io
    файлвоперативке = io.BytesIO()
    Ответ написан
    Комментировать
  • Как копировать файлы в python не используя модули shutil и os?

    Viktor_T2
    @Viktor_T2
    python developer
    CREATE_NO_WINDOW = 0x08000000 # не выводить окно консоли
    subp = subprocess.Popen('copy source.txt destination.txt', stdout = subprocess.PIPE, creationflags=CREATE_NO_WINDOW)
    subp.wait()
    как-то так
    Ответ написан
    1 комментарий