Поделиться через


Устранение неполадок при сбоях Node Not Ready, за которыми следует восстановление

Эта статья поможет устранить неполадки в сценариях, когда узел в кластере Microsoft Служба Azure Kubernetes (AKS) отображает состояние Узел не готов, но затем автоматически восстанавливается до работоспособного состояния.

Симптомы

Вы заметили, что приложение перестает отвечать на запросы, пока узел сообщает о состоянии "Не готово". Однако узел восстанавливается автоматически, и теперь он ищет анализ первопричин (RCA).

Причина

Возможные причины этой проблемы включают следующие сценарии:

  • Сервер API недоступен, и вы используете пробу готовности для развертывания.

    Если модуль pod работает, но не готов, эта ситуация означает, что проверка готовности завершается сбоем. Если проверка готовности завершается сбоем, модуль pod не присоединяется к службе и трафик не перенаправляется в экземпляр pod.

  • Происходит сбой узла виртуальной машины. Чтобы определить, произошли ли сбои узла виртуальной машины, проверка следующие источники информации:

Предотвращение

Чтобы предотвратить возникновение этой проблемы в будущем, выполните одно или несколько из следующих действий:

  • Убедитесь, что уровень служб полностью оплачен.
  • Уменьшите количество watch запросов и get к серверу API.
  • Замените пул узлов работоспособным пулом узлов.

Дополнительная информация