если взять вот это за основу:
track.ruward.ru/health
получаем 2837959 сайтов. средняя страница весит 100 килобайт (чисто html).
а дальше уже подумать о том как она будет парсицо и что из нее будет выдергивацо и на этой основе посчитать сколько она займет именно в конкретном индексе. у вас ведь нет алгоритма построения индекса от яндекса?)