Задать вопрос
  • Почему IO wait time на разных дисках влияет друг на друга?

    @grishao Автор вопроса
    Roman, под пачкой ID я имел в виду сразу несколько ID (от 10 до 300 в зависимости от нагрузки).
    Скрипт сюда скидывать не буду, суть вопроса не в нем. Когда размер каждой строки БД увеличивается, соответственно уменьшается рандомное чтение и скорость вырастает в несколько раз.

    Сейчас вижу по сути две корневые проблемы:
    1. Почему один диск сильно влияет на IO Wait другого диска (видимо из-за того, что они на одном контроллере, но при этом общая нагрузка двух дисков (4-10Мб/с) в десятки раз меньше предельно допустимой способности контроллера (300мб/с).
    2. В MongoDB надо искать возможность вычитывать данные таким образом, чтобы они читались с диска последовательно. Для этого обычно используют Clustered индексы, но в Mongo их нет. Еще бывают bulk read операции, но и их тоже по ходу нет в Mongo.
  • Почему IO wait time на разных дисках влияет друг на друга?

    @grishao Автор вопроса
    АртемЪ, скрипт разбит на две части. Первая собирает ID всех изменяемых данных. Вторая работает в два этапа. Первый этап - сбор всех ID всех данных MongoDB. Этот этап уже прошел, все id лежат в файлах (один файл на каждую коллекцию). Далее вторым этапом мы берем пачку ID и читаем из основного сервера данные MongoDB и сразу же пишем пачку в MongoDB резервного сервера, далее делается пауза и читается следующая пачка ID. Размер пачки и пауза регулируются в зависимости от торможения основного сервера.

    Как только все ID будут обработаны, будет запущен такой же процесс уже с ID первой части скрипта, который собирал все изменения в процессе основного копирования, чтобы синхронизировать базы окончательно.

    Сейчас думаем над тем, как можно читать MongoDB последовательно, так как данные там по ходу не кластеризованы на диске, чтобы добиться последовательного чтения, а не рандомного.
  • Почему IO wait time на разных дисках влияет друг на друга?

    @grishao Автор вопроса
    Но у меня есть отдельные графики io wait для обоих дисков и они разные. Так же iostat так же показывает данные отдельно для каждого диска. Обобщенный IO wait вижу в top.
  • Софт для вебинаров?

    @grishao
    А чем Webinar.ru не понравился?