Tkreks
@Tkreks
Системный инженер

AMI Asterisk (freepbx) как дебажить периодический отвал?

Здравствуйте!
Дано: 4 виртуалки. CHR (роутер) App(приложение обработчик), 2 виртуалки freepbx (FreePBX 16.0.40.7). Всё это крутиться в кластере vmware, для чистоты эксперимента загнал все виртуалки на один хост и запретил миграцию на другие хосты.
Под эту инфраструктуру выделен отдельный vlan.
1 ВМ freepbx - прод
Вторая ВМ freepbx под тестирование.
Проблема вот в чем. В Астериск включен AMI, SCOPE выставлен весь. Все события слушает машина APP, всё подключается и большинство событий считываются нормально.
Машина APP получается некоторые события с AMI (NewCallerid, Hangup, Newchannel и тд) вносит их в БД, производит определенные манипуляции. Проблема в том, что в течении дня некоторые события не доходят, т.к. не заполняются определенные поля в БД. Так же в логах астериска проскакивает такой лог:
remote unix connection disconnected

это сообщение также возникает в случаях, когда слушатель ami отключается от астериска принудительно.
Я бы подумал что проблема возникает на стороне слушателя (app), для этого развернул второй сервер asterisk, настроил всё заново, конфигурация freepbx минимальная без лишних заморочек, нет даже IVR. Клиенты подключаются по SIP (10-15 extensions) В общем, повторил конфигурацию на второй машине, сделал задание которое с случайной периодичностью (раз в 30-90 секунд) вызывает такие же события как и на 1 ВМ. Просчитал какое количество событий я должен увидеть в APP - и тут уже который день наблюдаю что получаю расчетное количество событий. Следовательно прихожу к выводу что машина ВМ2 работает без отвалов по AMI. А на машине ВМ1 - возникают отвалы на стороне AMI.
И количество событий в логе на ВМ2
remote unix connection disconnected

в десятки раз меньше чем на ВМ1.
Конечно, в качестве решения может подойти перенести прод на ВМ2, но есть большое желание разобраться в проблеме. Поделитесь мыслями как можно задебажить проблему или какие могут быть причины отвала ami. Достоверно известно что машина ВМ1 не перезагружается, сеть не теряет. Во время бэкапов делается снапшот, который на короткое время может приостановить машину - это понятно, эти случаи в расчет не беру.
UPD. Отличие ВМ1 (прод) от ВМ2 (для тестов) в том, что на ВМ1 проброшены порты для регистрации и медиа и светят в интернет. Ну и транк от провайдера не подключен к ВМ2. Собственно в остальном конфигурацию привёл к одинаковому виду.
  • Вопрос задан
  • 280 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы