Так получилось, что все лучшие книги по анализу данных издаются на английском.
Я бы посоветовал почитать классические книги Тревора Хасти и Роберта Тибширани:
1)
An Introduction to Statistical Learning - облегченная версия следующей книги с небольшим количеством матана, примеры реализованы на R. Электронная версия книги - бесплатная. По этой книге также есть
онлайн-курс от Стенфорда (начинается 19 января)
2)
The Elements of Statistical Learning - полный классический учебник по статистическому обучению, много математики. Книга, кстати, тоже бесплатна для скачивания.
Что касается классической статистики (включая корреляционный анализ) рекомендую посмотреть книги издательства Springer - у них есть хорошие книги по статистическому анализу в разных областях (финансы, экология и т.д.).