Привет.
Если что-то из литературы на русском языке - то это исключительно
Hadoop. Подробное руководство.
Указанная вами книга с плохим переводом и кучей ошибок.
Что касаемо дистрибутива - то на мой взгляд для первого знакомства проще всего посмотреть на дистрибутив от cloudera. Тем более там можно сразу потыкать в hbase, solr, hive и pig.
Более того, они
выкладывают преднастроенные виртуальные машины.
Что касаемо задач - в книге, что я написал, есть кейсы и ссылки для скачивания данных "на поиграться". Да и найти наборы данных довольно
просто.
Более менее ощутить дыхание мощи технологии можно на кластере из 3-4 машин, на одной виртуалке оценить это проблемно.