Пользователь пока ничего не рассказал о себе

Наибольший вклад в теги

Все теги (9)

Лучшие ответы пользователя

Все ответы (16)
  • Как категоризировать набор слов?

    @imageman
    Я так понимаю, что категории у тебя собственные, не такие, как у авторов нейросетей?

    Мне кажется (могу ошибаться) тебе следует набрать ключевые слова для каждой категории. По этим ключевым словам получаем вектор на предобученной модели (запоминать среднеарифметический вектор?). Не исключено, что придется какие-то категории разбить на подкатегории (для более однородных векторов ключевых слов).

    Для искомого слова также получаем вектор, затем вычисляем расстояние (эвклидово, косинусное и т.п.). С какой категорией расстояние минимально - то наше.

    В fastText есть возможность классифицировать текст или перевести слова в вектор.
    https://gosha20777.github.io/tutorial/2018/04/12/f... вроде там вполне доходчиво. Как я вижу там нужно самому учить классификатор (я так понимаю ты хочешь использовать что-то предобученное?). Ну и ещё почитать https://sysblok.ru/nlp/kak-rabotaet-fasttext-i-gde...

    И если ничего не получается, то ищем автора https://habr.com/ru/post/489474/
    Ответ написан
    Комментировать
  • В чём может быть причина мистической подмены доменов?

    @imageman
    Похоже на DNS кэширование.
    https://docs.microsoft.com/en-us/windows-server/ne...
    https://my.keyweb.ru/knowledgebase.php?action=disp...

    Вопрос в другом: зачем такое довольно сложное решение? Уточните проблему, возможно подскажут альтернативное решение (firewall, к примеру).
    Ответ написан
    2 комментария
  • Возможно ли обучить GAN без batchnorm?

    @imageman
    Да, можно без нормализации.

    Вот тут https://github.com/eriklindernoren/PyTorch-GAN собрано довольно много реализаций нейросетей (я оттуда с ESRGAN экспериментировал).

    FeedForward (это те, что полносвязные) практически тупиковый путь. Посчитайте сколько вы весов заложили в свою нейросеть. Для картинок пробуйте сверточные нейросети.
    Ответ написан
    5 комментариев
  • Как лучше изменить нейронную сеть?

    @imageman
    > 437 бинарных признаков. Есть обучающая выборка на ~400 случаев.

    Это означает, что нейросеть у вас будет переобучена. Для любого машинного обучения число строк обучения должно быть намного больше числа колонок. Если будете сокращать число колонок, это (по моему) в данном случае ничего кардинально не изменит.

    В нейросети лучше минимум один скрытый слой, если есть возможность то увеличивайте число скрытых слоев. Пробуйте различные конфигурации слоев ("бочка", "рюмка", "прямоугольник"). Выходной слой можно пробовать дискретное число (номер класса), а можно пробовать в выходном слое число выходов = числу классов (все нули, кроме одной единицы напротив нужного класса).
    Ответ написан
    1 комментарий