Пользователь пока ничего не рассказал о себе

Достижения

Все достижения (25)

Наибольший вклад в теги

Все теги (280)

Лучшие ответы пользователя

Все ответы (646)
  • Где я могу найти теорию по интернету, сетям, прокси-серверам, использованию IP и другим вещам, которые связаны с интернет-сёрфингом?

    deepblack
    @deepblack
    По сетям:
    • Олифер В. Г., Олифер Н. А. Компьютерные сети. Принципы, технологии, протоколы ISBN: 978-5-4461-1426-9
    • Таненбаум Э. С., Уэзеролл Д. Компьютерные сети. 5-е изд. ISBN:978-5-4461-1248-7

    При должном изучении эти книги заложат отличный теоретический фундамент.
    Ответ написан
    Комментировать
  • Ошибка при запуске сервера Django. Что делать?

    deepblack
    @deepblack Куратор тега Django
    Имя хоста написано кириллицей и Python 3.4 или старее?
    Windows: socket.gethostbyaddr(name) fails for non-ASCII hostname
    bugs.python.org/issue26227

    • Обновить Python
    • Переименовать хост
    • Либо запускать Django передав ему ip адрес вместо имени хоста python manage.py runserver 127.0.0.1:8000
    UPD:

    я попробовал воспроизвести подобную ошибку в среде Win 10 (в VirtualBox) и у меня получилось только в случае
    если в файле hosts присутствует алиас с кириллицей и локаль Windows русская.
    spoiler
    5cfb3a55d8bd0793644215.png5cfb39ec9a939231168766.png

    Если удалить русский, оставив только английский (на русском только интерфейс системы), то всё ок.

    Так-же не удалось воспроизвести ошибку если при запуске указывать ip хоста как 127.0.0.2
    python manage.py runserver 127.0.0.2:8080
    При условии, что в hosts нет алиаса с кириллицей для него.

    На чистой системе (установлены только Python 3.7.2 и Pycharm Community, русская локаль) подобной ошибки нет.

    Заглянул в исходники socket.py и socketmodule.c
    Скорее всего данная особенность связаны с этой частью исходного кода Python на C, а именно PyUnicode_DecodeFSDefault
    #ifdef MS_WINDOWS
        /* Issue #26227: gethostbyaddr() returns a string encoded
         * to the ANSI code page */
        return PyUnicode_DecodeFSDefault(name);
    #else
        /* Decode from UTF-8 */
        return PyUnicode_FromString(name);
    #endif


    Далее, если имя хоста не написано кириллицей и в hosts нет кириллицы следует вывод, что с высокой долей вероятности дело в стороннем софте(антивирус, кривой кряк и т.д.).
    Ответ написан
  • Есть ли в открытом доступе инструменты компьютерной лингвистики с целью анализа предложений русского языка?

    deepblack
    @deepblack
    Готового решения нет, но возможно вас заинтересуют следующие проекты:

    • Dostoevsky - Sentiment analysis library for russian language

    • Natasha - библиотека для поиска и извлечения именованных сущностей (Named-entity recognition) из текстов на русском языке. На данный момент разбираются упоминания персон, даты и суммы денег.
    • Yargy is a Earley parser, that uses russian morphology for facts extraction process, and written in pure python
    • razdel — библиотека для разделения русскоязычного текста на токены и предложения. Система построена на правилах.


    В догонку
    https://github.com/yandex/tomita-parser

    SyntaxNet (ссылка на Хабр) — это основанная на TensorFlow библиотека определения синтаксических связей, использует нейронную сеть. В настоящий момент поддерживается 40 языков, в том числе и Русский.

    UPD (17.03.2020):
    • Az.js A NLP library for Russian language
    • isanlp Natural language processing tools for English and Russian (postagging, syntax parsing, SRL, NER, language detection etc.)
    • russiannames Russian names parsers, gender identification and processing tools
    • rulemma Лемматизатор для русскоязычных текстов
    Ответ написан
    3 комментария
  • Как лучше всего логгировать web приложение на Python?

    deepblack
    @deepblack Куратор тега Python
    Sentry.io
    • integrating with the Python ecosystem
    • manual error and event capturing
    • configuration options
    • adding context (tags, user and extra information)
    • tracing issues with breadcrumbs
    • capturing user feedback on crashes
    Ответ написан
    Комментировать

Лучшие вопросы пользователя

Все вопросы (3)