Ответы пользователя по тегу Машинное обучение
  • Чем обрабатывать естественую речь?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Если речь идёт о русском языке - то читать про стемминг и лемматизацию.
    Ответ написан
    Комментировать
  • IDE с Искусственным интеллектом улучшающим код программы?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Такой IDE не существует. И не будет существовать. Объясню почему. В инфо-технологиях существует класс задач которые нельзя решить "просматривая глазами код". Например нельзя доказать что код обладает каким-то свойством. Например свойством что он остановится с гарантией после 100000 итераций. Чтобы такое доказать надо этот код скомпилировать и запустить. Грубо говоря рантайм или собственно работа кода является доказательством его правоты. И никакие статические анализаторы не способны глянуть глубже чем рантайм.

    Почему здесь важен рантайм? потому что автор говорит об алгоритмах сортировки и из контекста вытекает что его интересуют задачи именно производительности и скорости.

    Еще альтернативный вариант - просмотр кода человеком. Это работает. Иногда.

    Статические анализаторы могут просто подсказать какую-то простую ошибку типа потенциальный NPE или выход за границы массива. Но только в очень простых кейсах.
    Ответ написан
    1 комментарий
  • Что подавать на вход нейронке?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Дорог может быть миллион в зависимости от того что автор хочет получить на выходе.
    Если - посчитать количество гласных букв - то одно. Если категоризировать слово или слова
    то это другое. И возможно тут нужна предобработка слов. Стемминг или лемматизация.

    Вообще НС на вход получает векторы вещественных чисел. И преобразовать слово в эти векторы - большое искусство. Оно должно быть осмысленным. Если нам не удалось получить эти векторы - то бесполезно что либо делать. Нейронка на входе будет видеть шум. И никакого обобщения сделать не сможет.

    Поэтому давайте в топике спросим а как звучит настоящее техническое задание?
    Ответ написан
    Комментировать
  • Есть ли библиотека python/c# для сканирование печатных тестов?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Есть опенсорцная библиотека Tesseract. Как обращаться к ней напрямую из Python я не знаю. Но возможность такая должна быть. Убежден.
    Ответ написан
    Комментировать
  • Как из текста вытащить определения слов?

    mayton2019
    @mayton2019
    Bigdata Engineer
    Это сложная и интересная тема. На выходе ее должна стоять семантическая сеть. И есть у меня сомнения что на тостере кто-то даст окончательный совет. Да и вообще нельзя тут дать совет. Тут нужно направление. Как. Кодить самому? Или взать опенсорцную библиотеке? Или купить библиотеку.

    Мне также интересно откуда проистекает это техническое задание. Как минимум - дипломный проект.
    Ответ написан