luaPower, если брать слово, следующее за тем словом, которое содержит случайно выбранный символ/байт, то вероятность получить короткое слово станет выше вероятности получения длинного слова. Видимо об этом дефекте говорил mayton2019.
aleks-th, хранить длину каждого слова крайне затратно. Проще создать штук 100 индексов, которые будут указывать на некоторые слова по всему файлу, т.е. будут хранить позицию (смещение) слова, а не размер.
Рандом, конечно же, не совсем честный и сильно зависит от различия в длинах строк в файле.
В виду того, что файл очень большой, различия в длинах строк становятся очень несущественными для такого рандома. Так что твой вариант идеально подойдёт для моей задачи.
Так в спецификации RAID есть примерно 6 типов массивов. И не каждый из них ведь будет так делать.