Задать вопрос
@PavelKuptsov
IT инженер

Почему MongoDB вдруг начала тормозить при вставке данных?

Добрый день!
Есть скрипт который обрабатывает документы и вставляет результат обработки в MongoDB,
с некоторого момента (причину я так пока и не выяснил), вставка в БД стала жутко тормозить (до 4-5 сек! на операцию). Были приняты превентивные :) меры - удалили все индексы, добавили 1Гб памяти серверу - результат тот же. Для чистоты эксперимента начал писать в новую БД (пустую), пока писал в один поток - скорость вставки была приемлемой (менее 100мс), когда включил в два потока - скорость упала до 130-200мс, а через определенное время снова до 4000мс. При этом скрипт этот работал всегда в 1 поток, но требовалось ускорение обработки документов (которых около 5млн в неделю появляется).
МОнга настроена так:
net:
 bindIp: 127.0.0.1
 port: 27017
storage:
 dbPath: /var/lib/mongodb
 journal:
    enabled: true
 engine: wiredTiger
 wiredTiger:
  engineConfig:
   cacheSizeGB: 4
  collectionConfig:
   blockCompressor: snappy
systemLog:
   destination: file
   path: /var/log/mongodb/mongod.log
   logAppend: true


Я прихожу к выводу что просто железо не справляется, но может и ошибаюсь.
Сервер виртуальный (vmware): 4 Гб памяти (добавлял до 5Гб - но эффекта не дало),
Linux 3.16.0-4-amd64 #1 SMP Debian 3.16.7-ckt11-1+deb8u4
# lscpu
Architecture:          x86_64
CPU op-mode(s):        32-bit, 64-bit
Byte Order:            Little Endian
CPU(s):                4
On-line CPU(s) list:   0-3
Thread(s) per core:    1
Core(s) per socket:    2
Socket(s):             2
NUMA node(s):          1
Vendor ID:             GenuineIntel
CPU family:            6
Model:                 26
Stepping:              5
CPU MHz:               2000.071
BogoMIPS:              4000.14
Hypervisor vendor:     VMware
Virtualization type:   full
L1d cache:             32K
L1i cache:             32K
L2 cache:              256K
L3 cache:              4096K
NUMA node0 CPU(s):     0-3

Как можно полечить эту проблему?
Спасибо
  • Вопрос задан
  • 1286 просмотров
Подписаться 2 Оценить Комментировать
Пригласить эксперта
Ответы на вопрос 2
@lega
- Покажите какой запрос (на вставку) выполняете
- Какие индексы есть
- Что показывает explain() запроса
- db.stats(), + .stats() на вашей коллекции
- mongostat

когда включил в два потока - скорость упала до 130-200мс

Если условий при вставке нет и размер документа маленький, то скорость на $5 vps с ssd диском достигает 10к/сек, т.е. 0.0001 сек на операцию в среднем. Если у вас подобные запросы - значит монге не дают ресурсов, особенно io.
Ответ написан
@PavelKuptsov Автор вопроса
IT инженер
1. Запрос (их несколько но они идентичны по логике)
$col_doc->update(
            { url => $url },
            {
                '$set' => {
                    url      => $url,
                    reg_date => $reg_date
                  }

            },
            { upsert => 1 }
);

и вот в другую коллекцию:
$col_statistic->update(
            { ts => $start_time },
            {
                '$inc' => { $assist => 1 }
            },
            { upsert => 1 }
        );


2. Индексы все удалил - остался только _id_
3. explain без индексов показывает
"winningPlan" : {
                        "stage" : "UPDATE",
                        "inputStage" : {
                                "stage" : "COLLSCAN",
                                "filter" : {
                                        "url" : {
                                                "$eq" : "document.local"
                                        }
                                },
                                "direction" : "forward"
                        }
                },
                "rejectedPlans" : [ ]

с индексом по url:
"winningPlan" : {
                        "stage" : "UPDATE",
                        "inputStage" : {
                                "stage" : "FETCH",
                                "inputStage" : {
                                        "stage" : "IXSCAN",
                                        "keyPattern" : {
                                                "url" : 1
                                        },
                                        "indexName" : "url_1",
                                        "isMultiKey" : false,
                                        "direction" : "forward",
                                        "indexBounds" : {
                                                "url" : [
                                                        "[\"document.local\", \"document.local\"]"
                                                ]
                                        }
                                }
                        }
                },
                "rejectedPlans" : [ ]


4.
На коллекции:
{
        "ns" : "prepared.documents",
        "count" : 422836,
        "size" : 91540732,
        "avgObjSize" : 216,
        "storageSize" : 24944640,
        "capped" : false,
        "wiredTiger" : {
                "metadata" : {
                        "formatVersion" : 1
                },
                "creationString" : "allocation_size=4KB,app_metadata=(formatVersion=1),
-- порезано тут ---
        "nindexes" : 2,
        "totalIndexSize" : 10375168,
        "indexSizes" : {
                "_id_" : 4202496,
                "url_1" : 6172672
        },
        "ok" : 1
}

Это уже когда создал индекс по url
на БД
> db.stats()
{
        "db" : "documents",
        "collections" : 4,
        "objects" : 422843,
        "avgObjSize" : 216.49207625525312,
        "dataSize" : 91542159,
        "storageSize" : 25034752,
        "numExtents" : 0,
        "indexes" : 5,
        "indexSize" : 10444800,
        "ok" : 1
}


Это все данные с полупустой бд - на которой тоже тормоза начинаются при интенсивных инсертах

5. mongostat сейчас выложу.
insert query update delete getmore command % dirty % used flushes  vsize    res qr|qw ar|aw netIn netOut conn     time
    *0    34    732     *0       0     1|0     0.7    4.0       0 408.0M 234.0M   0|0   1|0  195k    95k   17 14:21:43
    *0    *0    260     *0       0     1|0     0.7    4.0       0 408.0M 234.0M   0|0   1|0   88k    34k   17 14:21:44
    *0    *0    230     *0       0     1|0     0.7    4.0       0 408.0M 234.0M   0|0   1|1   79k    31k   17 14:21:45
    *0    *0    332     *0       0     2|0     0.7    4.0       0 408.0M 234.0M   0|0   1|0  113k    39k   16 14:21:46
    *0     1    277     *0       0     3|0     0.8    4.0       0 408.0M 234.0M   0|0   1|0   91k    37k   17 14:21:47
    *0     7    488     *0       0     1|0     0.8    4.0       0 409.0M 235.0M   0|0   1|1  132k    65k   17 14:21:48
    *0    32    693     *0       0     1|0     0.8    4.0       0 409.0M 235.0M   0|0   1|0  183k    92k   17 14:21:49
    *0    14    508     *0       0     1|0     0.8    4.0       0 409.0M 235.0M   0|0   1|0  141k    67k   17 14:21:50
    *0    *0    243     *0       0     1|0     0.8    4.0       0 409.0M 235.0M   0|0   1|0   84k    32k   17 14:21:51
    *0    *0    247     *0       0     2|0     0.8    4.0       0 409.0M 235.0M   0|0   1|1   82k    33k   17 14:21:52
insert query update delete getmore command % dirty % used flushes  vsize    res qr|qw ar|aw netIn netOut conn     time
    *0    *0    187     *0       0     1|0     0.3    4.0       1 409.0M 235.0M   0|0   1|1   63k    28k   17 14:21:53
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы