• Создание нейронной сети для определения сортов яблок. Как осуществить?

    @kamenyuga
    Стоит начать с гугления по теме "apple cultivar classification" и поиска готовых/полуготовых решений. Если таких не найдется, то шансы на результат падают примерно до нуля.
    Написано
  • Стоит ли уходить в Data Science?

    @kamenyuga
    Можно начать с обычной аналитики без DS. К математике нужно добавить только SQL и Python на нормальном уровне, чтобы на собесе не теряться. В идеале еще логрегрессия, бустинг и метрики эффективности. В банковской/финансовой сфере за это сразу нормально платят. На старте 150 не гарантировано, а 100 абсолютно реально.
    Написано
  • Как исправить переобучение сверточной нейронной сети(keras)?

    @kamenyuga
    Дима Zero, эта тема называется data augmentation (обычно речь именно про изображения) и присутствует во всех нормальных учебниках и туториалах про машинное обучение и нейронки для работы с картинками.
    Написано
  • Как исправить переобучение сверточной нейронной сети(keras)?

    @kamenyuga
    150 изображений для обучения нейронки? Маловато будет. Вот и результат никакой. Классический для изучения нейронок набор данных MNIST содержит 60к картинок. На практике данных нужно как можно больше - миллионы и миллиарды, сколько бюджет и ресурсы позволяют, к тому же их дополнительно искажают по-всякому на каждой эпохе случайным образом.
    Написано
  • Как реализовать обучение нейросети в реальном времени?

    @kamenyuga
    Так гугли "nlp neural network" или "natural language processing", добавляя что-нибудь вроде guide, titorial, beginner. Будет тебе миллион наводок и про токенизацию, и про обучение нейронок с учителем, и про все остальное. Тема необъятная, большинство материалов на английском.
    Написано
  • Как разместить вентиляторы в корпусе LIAN LI PC-O11 Dynamic?

    @kamenyuga
    А фильтры от пыли там есть? Должны быть. Тогда я бы добивал все 6 оставшихся вентиляторов на вдув, чтобы поток воздуха внутрь через фильтры был больше, чем поток наружу. Получится, что через все прочие дырки воздух будет идти наружу и не будет лишняя пыль лезть внутрь. К этому бы еще добавить размещение системника не на полу, а повыше.
    Написано
  • Почему подсвечивается желтым / вообще не подсвечивается tensorflow.keras?

    @kamenyuga
    Известная особенность кераса. Раньше он был самостоятельной библиотекой, теперь часть тензорфлоу. И теперь использует так называемую ленивую загрузку вместо обычного импорта всего и сразу. Легко гуглится целая куча полукостыльных решений этой проблемы - "no autocomplete for keras in vscode".
    Написано
  • Как сделать так чтобы cin не принимал значения через пробел?

    @kamenyuga
    Обычно данные на входе просто есть. Сразу все или со временем, это ж поток. Они по очереди принимаются и обрабатываются. Либо сразу всё принимается, а потом по очереди обрабатывается. Конечно, входные данные должны соответсвовать формату либо приниматься как строка. В данном случае непонятно, чего в итоге нужно-то. Вероятно, поможет просто cin.ignore(1024, '\n') после чтения z. Или всё-таки сначала всё прочитать через getline в строку или отдлельные значения в vector.
    Написано
  • Что делает единичная звездочка в аргументах метода Python?

    @kamenyuga
    А еще есть одинарный слеш. Он, правда, появился относительно недавно. И слеш, и звездочка легко гуглятся. На английском гуглится попроще.
    Написано
  • Какие задачи из Data Science упираются в скорость даже самых топовых SSD?

    @kamenyuga
    Если на диске данные у тебя лежат в подгтовленном виде, т.е., например, полность готовые запикленные тензоры для кераса, то скорость работы запросто упрется в производительность диска или скорость передачи данных между диском/процом/памятью. Правда, это ситуация редкая и вообще никак не связана с прикладной задачей, определяется просто способом работы с данными.
    Написано
  • Можно ли дообучить модель нейронной сети?

    @kamenyuga
    br0_oJ, если много-много классов можно разделить на независимые группы, то, конечно, можно обучать одну нейронку на каждой группе классов, а потом несколько нейронок просто заворачивать в единую обертку, это стандартный функционал того же тензорфлоу. Только придется написать логику соединения ответов нескольких нейронок (в простейшем случае - конкатенация).
    Написано
  • Можно ли дообучить модель нейронной сети?

    @kamenyuga
    br0_oJ, безосновательное заявление. Сколько бы ни было классов, все равно нужно все данные для обучения прогнать через архитектуру нейросети несколько раз (эпох). А количество классов задает размер буквально пары полносвязных слоев на выходе, т.е. ничто по сравнению с многослойными свертками того же резнета. Может, вопрос скорее в соответствии между задачей и возможностями? На безвидеокартье и процессор видеокарта.
    Написано
  • Можно ли дообучить модель нейронной сети?

    @kamenyuga
    Откуда такое разделение, сначала 10, потом еще 20? Данных для обучения нет? Они не размечены? В любом случае проще будет еще раз обучить всю нейронку заново. Именно так оно и делается.
    Написано
  • Сколько линий PCI-E нужно для работы нейросетей?

    @kamenyuga
    Веса нейронки и, правда, никуда не подгружаются, они просто загружены в память и используются. А вот уже сами данные (обучение, тест, применение) постоянно преобразуются и перемещаются между диском, оперативкой, видеокартой и, конечно, процом, который все эти данные и гоняет туда-сюда-обратно.
    Написано
  • Как создать объектную модель содержимого файла?

    @kamenyuga
    Эта тема обычно называется просто парсинг, там есть слова DSL, BNF, Lex Yacc. Если взять, например, питон, то там есть куча разного уровня универсальности и сложности библиотек специально для парсинга чего угодно. Две популярных - это PyParsing и PLY (Python Lex Yacc). Они даже в учебниках по питону часто разбираются, но тема, конечно, сложная, копипаста из гугла сама по себе не заработает.
    Написано
  • Не запускается код скомпилированный с помощью pyinstaller на другом компе, что делать?

    @kamenyuga
    Компьютеры же разные. Что показывает ipconfig на этих двух пк?
    Написано
  • Как использовать CNN, если один из каналов - входные данные, а другой - выходные?

    @kamenyuga
    Rektalizer, такую задачу можно хотя бы попробовать решить. Первая большая сложность в том, что надо рассказать нейронке про взаимное положение полигонов. Очевидный вариант - двумерная карта/картинка и свертки. Тут сразу куча деталей про размер, масштаб и способ кодирования инофрмации. С рекуррентными нейронками будет еще сложнее. Вторая большая сложность - таргет. Наверное, стоит за раз предсказывать положение только одной поливалки - изначально их нет, а потом они по одной добавляются в подходящее место, пока польза от них еще есть. Тут-то возникает третья умеренная сложность - функция потерь . По дефолту это ж будет просто расстояние, на которое нейронка ошиблась (не забыть про масштаб из первой сложности), а возможно надо сразу реализовать типа человечью логику выбора места (особенно если данных мало). Ну, вот и все - решаем три сложные проблемы, обучаем, тестируем, победа.
    Написано
  • Как использовать CNN, если один из каналов - входные данные, а другой - выходные?

    @kamenyuga
    Для данных с сильно разным размером обычно используют рекуррентые нейронные сети. В этом случае каждую сущность (полигон) подают по очереди. А в сверточные сети подают все сразу, но в виде двумерной карты/картинки (или нескольких), в которой каждый пиксель чем-то заполнен, т.е. просто набор полигонов не подходит, надо его на координатную плоскость положить. Но в любом случае надо начать с постановки задачи и формализации входных и выходных данных. Из этого потока сознания можно сделать вывод, что вроде речь идет об оптимальном размещении поливалок, - в таких случаях обычно начинают не с нейронок, а если доходят до неройнок, то почти всегда приходится существенно преобразовывать имеющиеся данные и временами даже вручную дорабатывать функцию потерь.
    Написано