• Можно ли по книгам из серии "Математика в техническом университете" изучать математику для ML?

    @dmshar
    Математика - она едина. А разные книги просто по-разному ее излагают: разные аргументы, разные стили изложения, немного разная последовательность тем, разные акценты, разная глубина обсуждения конкретных тем и пр. Нет лучших и худших книг (кстати, и видеокурсов - тоже). Разным людям индивидуально может больше подходить стиль одной книги или лектора, другим - другие. Не факт, что если кто-то тут напишет "это суперучебник" то для вас он подойдет. И наоборот, если кто-то скажет "отстой" - то мы не знаем, это книга плохая, или мозги написавшего просто были не способны ее воспринять.
    Так что если у вас есть выбор - просто пробуйте. Берете одну книгу, изучаете, смотрите, как "заходит" материал именно в вашу голову. Если все ОК, то и хорошо. Что-то пошло "не так" - пробуем другую книгу.
    Если вдруг потом вы обнаружите, что какого-то фрагмента знаний, который вам друг оказался нужным не было в том учебнике, по которому вы учились - а так бывает, и не редко - то вот именно "потом" и "доберете" недостающий материал по каким-то другим источником. Это неприменно будет, но будет сильно "потом".
    Другое дело, что самостоятельное изучение, очевидно (по вопросу) - "с нуля", это весьма непростой и тернистый путь. И скажу откровенно, не многие в состоянии его осилить. Но будем считать, что вы из числа этих немногих. Удачи.
    Ответ написан
    Комментировать
  • Метод опорных векторов как нарисовать гиперплоскость?

    @dmshar
    Как-то неясно, в чем суть вопроса.
    Метод опорных векторов как раз и имеет результатом прямую (плоскость, гиперплоскость) разделяющую классы объектов. Т.е. прямой ответ на ваш вопрос звучит так: применяете метод опорных векторов, находите параметры разделяющей поверхности ( в двумерном случае - параметры прямой) и если надо - ее рисуете.
    Ответ написан
    Комментировать
  • Как найти работу в машинном обучении новичку?

    @dmshar
    Да, Erlang - это не про машинное обучение. Наверное, в ВШЭ вам даже объяснили почему. Так что хотите работы- идите "за рынком", т.е. учите то, что требуют вместе с МL и Big Data.
    P.S. А как это вас угораздило начать заход в IT с Erlang/Elixir? Как бы очень нетривиальная калитка.
    Ответ написан
    3 комментария
  • С чего начать изучение ИБ?

    @dmshar
    Информационная безопастность в веб - это не только инъекции. Давеча на Тостере была тема, которая перекликается с вашей на 99%.
    Взгляните:
    Какую литературу о снифферах, сетевых анализаторах можно почитать?
    Ответ написан
  • Какую литературу о снифферах, сетевых анализаторах можно почитать?

    @dmshar
    Позвольте задать наводящий вопрос - а что такое сеть, что такое сетевые протоколы, какие они бывают, как взаимодействуют, как управляются - вы уже выучили? Просто - если "да" то ответы на большинство ваших вопросов вы уже должны знать. А если "нет" - то начинать надо не с снифферов, а именно с того, о чем я написал. И начать можно хоть с классики:
    В. Олифер, Н. Олифер «Компьютерные сети. Принципы, технологии, протоколы.
    Ответ написан
    Комментировать
  • Построить графики в R?

    @dmshar
    А что вам мешает? В R средств визуализации даже больше, чем нужно. Выберейте тот что нравиться и стройте. Ну или если совсем все грустно - то начните с книг, например
    С.Э. Мастицкий, В.К. Шитиков СТАТИСТИЧЕСКИЙ АНАЛИЗ И ВИЗУАЛИЗАЦИЯ ДАННЫХ С ПОМОЩЬЮ R
    Ответ написан
  • Что поможет вывести названия регионов в RStudio?

    @dmshar
    Посмотрите тут
    Ответ написан
    Комментировать
  • Как последовательно склеить несколько картинок в одну или PDF?

    @dmshar
    Photoshop умеет работать с PDF-файлами. Правда - это не "консольно Linux", но зато он умеет делать с картинками "все", включая "склеить".
    Ответ написан
    Комментировать
  • ML распознавание лиц по видео. Каков приблизительный ценник за подобный проект?

    @dmshar
    Если у топикстартера есть ресурсы, сравнимые с ресурсами Китая, то шанс получить то, на что он замахнулся у него есть :
    https://tjournal.ru/65956-kitayskaya-policiya-nach...
    Вот если денежек чуть меньше, тогда грусть-тоска. :-)
    А по вопросу о необходимости срочного приобретения всего лишь сервера, склоняюсь к тому, что денежек явно не густо.
    Ответ написан
    Комментировать
  • Выбор доменной зоны по изображению?

    @dmshar
    Думаю, потому что ответ очень субъективен. Почему девушка в купальнике должна быть "SEXY", а не "swimsuit", или "beach"?
    Подходы к решению - берем большой корпус картинок, вручную помещаем их теми тегами, которые мы считаем правильными, строим модель а потом используем ее.
    Ответ написан
    Комментировать
  • Есть ли ещё место на рынке онлайн-сервисов для ежедневника?

    @dmshar
    Место-то есть. И создать сервис - не проблема. Но вот убедить других, что это то, без чего они обойтись ну никак не могут - вот в чем вопрос. Сам привел примеры сервисов, которые как бы есть, но и как бы "не то". Т.е. им не удалось доказать, что они "то что надо". И это происходит не потому, что сервис плох, а потому что на раскрутку не хватает в первую очередь денег, но и других ресурсов (времени, рабочих рук, продуманной рекламы и пр.)
    Если готов обеспечить эту составляющую - есть смысл тратить энергию, если нет - то я бы не советовал. Свои ресурсы можно использовать с большей пользой.
    Ответ написан
    Комментировать
  • Какую БД использует prometeus?

    @dmshar
    Как минимум, существуют
    prometeus.net
    prometeus.nl
    а также
    prometheus.org.ua
    prometheus.io

    Вы в чью базу данных напрямую "r/w" хотите?
    Ответ написан
  • Есть ли разница между моделью Маккалока-Питтса и персептроном Розенблатта и какая?

    @dmshar
    Интересно, сейчас пишут "исследовательскую" работу, забанив себя в Гугле? Это же вопрос раскрывается на первых страницах любой книги по нейронным сетям.
    Ну вот, первая же ссылка в Гугле:
    https://www.intuit.ru/studies/courses/3456/698/lec...
    - на третьей странице про Маккалока-Питтса, на четвертой про Розенблатта.
    А тут - вообще все на одной странице:
    https://www.osp.ru/os/1997/04/179189
    "Исследуйте"!
    Ответ написан
    Комментировать
  • Какого рода проекты можно перевести на блокчейн?

    @dmshar
    На блокчейн имеет смысл переводить проекты, в которых имеется:
    - распределенный источник информации,
    - запрет на изменение чего-либо, попавшего в систему,
    - связь (зависимость) предыдущий документов с последующими,
    - общедоступность или наличие открытой и закрытой частей.,
    - нежелание (нецелесообразность, невозможность) сосредоточить хранение информации в одном месте.
    К таким проектам можно отнести:
    - хранением документов, например - экономических договоров,
    - информация о владении недвижимостью,
    - историй болезни,
    - дипломы,
    - кадастровая информация,
    - информация о семейном состоянии, месте регистрации,
    - "трудовые книжки" или информация необходимая для пенсионных фондов,
    - информация о владении (или истории ремонтов) автомоблия,
    - ихранение информации о ходе/результатах выборов,
    и т.д.
    Ответ написан
    Комментировать
  • Есть ли более 1 кластера?

    @dmshar
    Вообще то есть такой раздел Data Mining, как кластерный анализ. И для решения задач типа вaшей разработано наверное десятков пять различных методов. В том числе - и "без ручного задания порога" (скажу по секрету - можно обойтись вообще без какого-бы то ни было задания порога).
    Ваш случай - простейший, одномерный. В жизни встречаются задачи намного сложнее. Но в любом случае, выбор подхода и конкретного метода кластеризации зависит от данных - и от того, в какой шкале они измерены, и сколько их, и известно-ли их распределения, и какие меры близости можно ввести в пространстве признаков. Там же рассматривается вопрос, а как ОБОСНОВАНО выбрать количество, на которых разбивается выборка и как выявить аномалии-выбросы. В довершении всего имеются методы сравнения методов между собой.
    Если говорить конкретно про Ваш пример, что данных настолько мало и кластеры настолько выражены, что тут сомнений нет. Но а если Вас проблема интересует более глубоко - то без изучения теории не обойтись. Часто кластеризацию изучают как одно из направлений в рамках машинного обучения и рассматривают в соответствующих книгах/курсах. Могу порекомендовать в качестве "затравки"-

    https://habrahabr.ru/post/101338/
    https://habrahabr.ru/company/ods/blog/325654/
    Флах _"Машинное обучение - наука и искусство построения алгоритмов",
    Барсегян "Анализ данных и процессов"
    и более серьезные источники:
    Мандель "Кластерный анализ"
    Ким "Факторный, дискриминантный и кластерный анализ"
    Миркин "Методы кластер-анализа"
    Aggarwal, Chandan K. "Reddy-Data Clustering_ Algorithms and Applications"

    и пр.пр.пр. Источников по теме -море.
    Удачи.
    Ответ написан
    7 комментариев
  • Какую литературу выбрать для изучения WINAPI?

    @dmshar
    Еще немного классики.
    https://www.ozon.ru/context/detail/id/2575245/
    Довольно доходчиво написано.
    Ответ написан
    Комментировать
  • Может ли нейросеть писать простые статьи?

    @dmshar
    Если придумаете как обучить нейронную сеть - то почему нет.
    Вон, музыку пишет. И картинки рисует (переделывает, стилизует). Но "готовых решений", по крайней мере общедоступных - конечно нет. Придется самому попотеть. Построить сеть, обучить ее, получить результат. Дерзайте, может получится.
    Ответ написан
    Комментировать
  • Что было первым: файл или директория :)?

    @dmshar
    С точки зрения любой операционной системы, директория - это всего-лишь файл с специфическим форматом содержимого.
    Что-бы было понятнее - файлы .txt умеют обрабатывать текстовые редакторы, файлы xls - умеет обрабатывать MS EXCEL, jpg -Photoshop. Т.е. данные программы "знают" внутренний формат файлов, имеющих указанное расширение и поэтому могут с ними работать (при этом - не знают формат файлов с другими расширениями и работать с ними не умеют).
    Точно также операционная система, как любая другая программа, тоже "знает" как работать с файлами определенных расширений. (Например, она "знает", что exe-файл надо просто загружать в ОЗУ и выполнять). При этом она ( а вернее - ее компонент, который выполняет функции управления доступом к информации на внешних носителях) "знает", что файл-директорий просто содержит внутри себя информацию - описание других файлов на том-же носителе, например - имя таких файлов, их физическое месторасположение, дату создания, дату модификацию, возможно - размер и т.д. Причем, в качестве таких файлов может выступать и другие директории, именно так связывая их в иерархию директорий на диске.
    Так что ответ однозначен - первично понятие файла, понятие директории - вторично.
    Ответ написан
    Комментировать
  • Как прикручиваются тесты на лендинг?

    @dmshar
    Готовых решений - море.
    От Google Forms до WorldPross-плагина WP-pro-quiz (мой выбор).
    Можно найти и другие. Выбирайте и пользуйтесь.
    Ответ написан
    Комментировать