1) Какие марки/модели сейчас наиболее надежные (WD/Toshiba/Seagate)?
Тошиба подешевле и хитачи (ультрастар) подороже.
2) С точки зрения экономии финансов какой объем на сегодняшний день оптимально брать?
Если просто самые эффективные по соотношению объем/цена то 4Tb
3) Есть ли особенности хранения большого количества мелких файлов (хтмл-файлы, имейджи к ним)?
Насколько мелкие? Как вы будете объединять дисковое пространство? Фактически тут играет размер получаемого после объединения блока. Чем больше блок, тем больше производительность на больших файлах, и тем больше оверхед по дисковому пространству на мелких файлах.
Я у себя считал оверхед на тестовой выборке файлов из таблички метаданных:
SELECT (sum(ceil(f.size_/:block_size))*:block_size)/ sum(f.size_) AS koef FROM files f
и на моих данных уменьшать размер блока меньше 16384 не имело смысла, т.к. разница в пару процентов не принципиальна.
и не следует класть миллионы файлов в одну директорию....
Вы будете держать файлы в фс, бд или свои велосипеды?
Файлы раскладывал по директориям по алгоритму /file_dir/{md5h::substr(0,2)}/{md5h::substr(2,2)}/sha256h
Хеши нужно было просчитывать по задаче, так что не особо напрягался за экологию.