Ответы пользователя по тегу Компьютерная лингвистика
  • Как обрабатывать слова написанные разным способом?

    xmoonlight
    @xmoonlight
    https://sitecoder.blogspot.com
    Можно смотреть первые буквы (и несколько первых букв, и выбрать лучший вариант по совпадениям) во всех корнях в подряд идущих слов, учитывая предлоги между ними с вероятностью в 50% (проверять с предлогами и без, и выбирать лучшее совпадение).

    Это покроет большинство случаев.

    И свой словарь для нескольких частных случаев - тоже можно сделать: чем больше классификаторов - тем лучше.
    Ответ написан
    Комментировать
  • Как называется лингвистический алгоритм по переводу утверждения в вопрос?

    xmoonlight
    @xmoonlight
    https://sitecoder.blogspot.com
    Тут вот, похоже что-то есть.
    Кратко: Метод генерации на основе текстового корпуса + метод генерации вопросов по шаблонам.
    В помощь по извлечению "цепочек" из текстового корпуса могу предложить готовую функцию на PHP и/или этот список инструментов.
    Ответ написан
    2 комментария
  • Расстановка недостающих пробелов в тексте. Как сделать корректно?

    xmoonlight
    @xmoonlight Автор вопроса
    https://sitecoder.blogspot.com
    Пока 2 варианта вижу:
    1. Простой - разрыв несуществующих цепочек (окружение по 8-10 символов брать и разделять там, где нужно) и часть правил слитно/раздельно ("НЕ"/"НИ" и т.д.) - сделать регулярками.
    2. Сложный - НС строить и обучать уже по-полной, включая проверку орфографии и разбор предложения по частям речи (+получение структуры предложения и смысла текста).
    Ответ написан
    Комментировать
  • Что такое микросервис?

    xmoonlight
    @xmoonlight
    https://sitecoder.blogspot.com
    Микросервис - это любой демонический сокет, порождаемый и/или управляемый сторонним/контролирующим процессом, обрабатывающий какие-либо данные со сложными вычислениями по запросу. Обычно, является нативным по отношению к ОС для обеспечения максимальной производительности вычислений.
    Ответ написан
    Комментировать
  • Есть ли в природе адекватные книги или статьи по возможным способам общения с внеземными цивилизациями?

    xmoonlight
    @xmoonlight
    https://sitecoder.blogspot.com
    1. Визуально: рисунки, жесты и оценка реакции на различные воздействия (воспитание детей и дрессура животных)
    2. С помощью сообщений: мы общаемся через засечки во временных интервалах: графически - это пробелы/линии; логически - это расстояния/паузы (аналог - азбука Морзе) и соответствующие им визуальные образы (буквы,цифры, изображения).

    Протокол начального обмена информацией достаточно прост:
    1. Установка связи (PING/PONG): ответ тем же пакетом (полученными данными):
    Получили: [пакет]
    Отправили: [пакет]
    2. Обучение языку:
    отправка: [X][пакет][Y] (X есть Y)
    ответ: [X][пакет][Y]
    3. Проверка результата:
    вопрос (?): [X][пакет][Y]
    ответ "ДА": [X][пакет][Y]
    ответ "НЕТ": [пакет]
    Ответ написан
    Комментировать