Добрый день.
Коллеги, хаотично в разные интервалы рабочего времени пропадает доступ по smb к сетевым папкам. Сервер доступен по rdp и ICMP.
Инфраструктура:
Гипервизор на базе Windows Server 2012 r2 с последними обновлениями.
E5-2650v4 -2шт, 128 GB Memory, Raid 5 7200.
Виртуальная машина - Windows Server 2012 r2 с последними обновлениями.
Cpu 2 core 10k memory
Коллеги, с проблемой боремся уже более 3 месяцев, далее хронология:
1) Первоначально ВМ базировалась на 2008 r2 и мы начали получать аналогичные проблемы. Так как постепенно переводим остальные сервисы на 2012 r2 и оперативно найти причину проблемы мы не смогли, решили перевести машину на 2012 r2.
Новая VM устанавливалась с образа MSDN
Обновлена полностью
Диск от старой VM с данными шар был отключен, сконвертирован в VHDX, подключен и через реестр были перекинуты сетевые шары.
Машина функционировала несколько дней нормально, но проблема повторилась.
2) Объем диска с данными был равен 1300 гб. Решили разбить его на два куска и посмотреть что будет с сервисом.
Был подключен диск и на него переехало 700 гб данных.
Перенастроены в ручную перенесенные сетевые папки.
Проблемы остались, но было зафиксировано следующее поведение:
Пропадает доступ только к части сетевых папок. При открытии проводника, пропадает 1 из дисков.
3) Решили повторно перенести данные на новые диски. Но уже переделать NTFS права на папках и избавится от диска, который ранее был сконвертирован.
Проблема осталась, но нашли на течнете аналогичную статью от 2012 года с более чем 300-ма записями:
https://social.technet.microsoft.com/Forums/Window...
4)
- В статье был предложен метод перегрузки службы "Server" - сервис переходит в статус "остановка" и зависает.
- Была отключена система резервного копирования UDP Arcserver, но проблема повторилась и после выключения бекапа.
- Передвинули машину на другой сервер с другой аппаратной частью (C Supermicro - на HP 380g7)
Добавлен ключ REG ADD HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\lanmanserver\parameters /v DisableLeasing /t REG_DWORD /d 1 /f
- Добавлен ключ reg add HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Servic es\lanmanserver\parameters /v MaxThreadsPerQueue /t REG_DWORD /d 1024 /f
5) Так как все предложенное с форума нам не помогло, начали анализировать сессии которые были открыты в момент зависания.
Было предложено, что мы имеем 3 проблемных сервиса на файловом ресурсе:
- Linker Server с 2014 SQL
- Базы MSACCESS 2003
- И некоторая папка с огромными путями
Решили первым делом передвинуть базы MSACCESS с одного диска на другой и получили ситуацию:
Ранее у нас пропадал диск E, после переноса начал пропадать диск F.
6) Перенесли базы access на другой сервер и после 4 дней стабильной работы снова получили ошибки.
Но теперь при появлении проблемы были зафиксированы битые файлы:
xlsx документ с которым работал сотрудник
pdf документ, который сохранялся на сетевую шару.
Находимся в стадии шока и не понимаем за что можно зацепится.