Ответы, понравившиеся пользователю Роман Скваж

Какие порекомендуете статьи на русском про архитектуру WEB-приложений?

Сергей Мартынов @smart

вы меня знаете

Недавно был аналогичный вопрос и я писал развернутый ответ к нему: Как повысить знания в области архитектуры веб проектов?

Повторю вкратце: много информации есть в открытом доступе, начиная от вводных статей начального уровня (типа habrahabr.ru/post/15362 - моя очень давняя публикация), заканчивая докладами с конференций, на которых разбираются и глубокие частные вопросы.

Например, в интернете доступны записи с многих технологических конференций:
https://techforum.mail.ru/video/
https://tech.yandex.ru/events/yac/
ritconf.ru/archive и www.highload.ru (тут видеозаписей нет, но есть слайды почти всех презентаций)

Ответ написан более трёх лет назад

Комментировать

Какие читать книги по machine learning?

Дмитрий Демидов @ptitca_zu

Programmer. Reader. Introvert

Яндекс недавно выложил на Хабре свои лекции по машинному обучению. Начал смотреть – более фундаментальный подход, чем у Эндрю (его курс тоже с интересом прошел).

Насчет читать, я, например, сразу после курса взялся за building ml systems with Python.

Очень подробная книга и с языком сразу.

Ответ написан более трёх лет назад

Комментировать

Какие читать книги по machine learning?

B@rmaley.e><e @barmaley_exe

Для начала можно взять какие-нибудь онлайн курсы, а потом уже переходить к серьёзной литературе.

Здесь есть ревью многих книг по ML. Они все на английском, да.

Насчёт русскоязычной литературы ничего не скажу, но на machinelearning.ru есть краткий список литературы.

Ответ написан более трёх лет назад

Комментировать

Упал faсebook.com?

Codewalker @Codewalker

Он ушел, но обещал вернуться. Пока можете в своем hosts прописать что-то из

66.220.153.19 www.facebook.com
66.220.153.23 www.facebook.com
66.220.156.16 www.facebook.com
66.220.156.32 www.facebook.com
66.220.156.48 www.facebook.com
66.220.156.64 www.facebook.com
66.220.158.11 www.facebook.com
66.220.158.18 www.facebook.com
66.220.158.25 www.facebook.com
66.220.158.32 www.facebook.com
66.220.158.47 www.facebook.com
66.220.158.53 www.facebook.com
69.63.189.11 www.facebook.com
69.63.189.16 www.facebook.com
69.63.189.26 www.facebook.com
69.63.189.31 www.facebook.com
69.63.189.34 www.facebook.com
69.63.189.39 www.facebook.com
69.63.189.70 www.facebook.com
69.63.189.74 www.facebook.com
69.63.189.78 www.facebook.com
69.63.189.79 www.facebook.com
69.63.190.10 www.facebook.com
69.63.190.14 www.facebook.com
69.63.190.18 www.facebook.com

Ответ написан более трёх лет назад

Комментировать

Упал faсebook.com?

Влад Животнев @inkvizitor68sl

Linux-сисадмин с 8 летним стажем.

facebook.com has address 69.171.229.11
facebook.com has address 69.171.224.11
facebook.com has address 66.220.149.11

Ответ написан более трёх лет назад

Комментировать

Упал faсebook.com?

dmsn @dmsn

Так anonymous обещали же.
Уже работает.

Ответ написан более трёх лет назад

1 комментарий

Критерии выбора значимых признаков для SVM классификации (метод опорных векторов)?

YasonBy @YasonBy

Прежде всего, не нужно зацикливаться на SVM: это всего лишь один из многих методов классификации. Да, у SVM есть своя специфика (у других методов — своя), но на данном этапе Вы вполне можете использовать общие алгоритмы предобработки данных.

какие именно признаки брать?

Это называется feature selection и feature extraction.

Простыми словами, процесс выглядит так:
1. Составляем список имеющихся признаков.
2. Добавляем в него различные функции от признаков (как упомянутый логарифм от веса), комбинации разных признаков (например, длина*ширина*высота), и т.п. Что именно комбинировать и какие преобразования использовать, должно подсказать знание задачи и здравый смысл. Этот процесс относится к feature extraction.
3. Задаём функцию ошибки, то есть определяем как будет оцениваться точность классификации. Например, это может быть отношение правильно распознанных примеров к их общему количеству. Здесь полезно почитать про precision and recall.
4. Переходим на один уровень абстракции выше.
Представим эдакий чёрный ящик, внутри которого находится классификатор вместе с обучающей и тестирующей выборками. На входе ящика — двоичный вектор, указывающий, какие признаки должен использовать классификатор; на выходе — величина ошибки классификации (на тестовой выборке).

Таким образом, задача выбора признаков сводится к задаче оптимизации: нужно найти такой входной вектор, при котором выходное значение ящика (ошибка классификации) будет минимально. Можно, например, добавлять признаки по одному (начиная с тех, которые сильнее всего улучшают результат) — см. градиентный спуск. Можно использовать что-то посерьёзнее, типа генетических алгоритмов.

Нужно ли при этом нормализовывать численные значения этих признаков?

Это сильно зависит от конкретной задачи и самих признаков.

Что делать если количество зерен в реальности (в обучающей выборке) относится к количеству плевел как 1/200? Портит ли это обучающую выборку?

В общем случае, портит: если одних примеров гораздо меньше, чем других, существует риск, что классификатор «запомнит» примеры из обучающей выборки, и не сможет адекватно разпознавать другие похожие примеры (Overfitting).
К тому же, если используется простейшая функция ошибки (правильно_распознанных / размер_выборки), философски настроенный классификатор может всегда отвечать «плевел» — и в 99.5% случаев будет прав :)

Ответ написан более трёх лет назад

1 комментарий

Какие порекомендуете статьи на русском про архитектуру WEB-приложений?

Какие читать книги по machine learning?

Какие читать книги по machine learning?

Упал faсebook.com?

Упал faсebook.com?

Упал faсebook.com?

Критерии выбора значимых признаков для SVM классификации (метод опорных векторов)?

Войдите на сайт