Всем привет!
На протяжении достаточно долгого времени занимаюсь data-science - модели, оценка параметров, тестирование гипотез и т.д.
Однако я ощущаю некую бессистемность знаний по этому вопросу, характерный пример - я знаю, как работают смеси гауссиан и как они могут применяться при кластеризации, умею использовать их с помощью sklearn, но не знаю как работает EM-алгоритм. Таких примеров у меня достаточно много, и я ощущаю себя code-monkey - я вроде как строю модели, но глубокого понимания математики и методов, используемых в этих моделях, мне явно нехватает.
В связи с этим хочу почитать какую-нибудь увесистую, фундаментальную книжку о алгоритмах, методах и моделях, используемых в data-science (на русском или английском - не имеет значения). Подскажите, с чего начать?