Устранение неполадок при сбоях Node Not Ready, за которыми следует восстановление
Эта статья поможет устранить неполадки в сценариях, когда узел в кластере Microsoft Служба Azure Kubernetes (AKS) отображает состояние Узел не готов, но затем автоматически восстанавливается до работоспособного состояния.
Симптомы
Вы заметили, что приложение перестает отвечать на запросы, пока узел сообщает о состоянии "Не готово". Однако узел восстанавливается автоматически, и теперь он ищет анализ первопричин (RCA).
Причина
Возможные причины этой проблемы включают следующие сценарии:
Сервер API недоступен, и вы используете пробу готовности для развертывания.
Если модуль pod работает, но не готов, эта ситуация означает, что проверка готовности завершается сбоем. Если проверка готовности завершается сбоем, модуль pod не присоединяется к службе и трафик не перенаправляется в экземпляр pod.
Происходит сбой узла виртуальной машины. Чтобы определить, произошли ли сбои узла виртуальной машины, проверка следующие источники информации:
- AKS диагностика
- Состояние Azure
- Уведомления Azure (о любых недавних сбоях или периодах обслуживания)
Предотвращение
Чтобы предотвратить возникновение этой проблемы в будущем, выполните одно или несколько из следующих действий:
- Убедитесь, что уровень служб полностью оплачен.
- Уменьшите количество
watch
запросов иget
к серверу API. - Замените пул узлов работоспособным пулом узлов.
Дополнительная информация
- Общие действия по устранению неполадок см. в статье Основные сведения об устранении неполадок при сбоях node Not Ready.