Доклад

4 способа выявления сбоев узла в Kubernetes: актуальные стратегии возвращения рабочей нагрузки

  • На русском языке

Выход из строя рабочего узла кластера Kubernetes — всегда непредсказуемое событие, влекущее за собой различные влияния на рабочую нагрузку. 

Расскажу, как сделать такие ситуации не просто менее стрессовыми, но и максимально управляемыми.

Рассмотрим:

  • Как Kubernetes обнаруживает сбои узлов. Что вы можете сделать для того, чтобы улучшить этот процесс. 
  • Node-problem-detector (NPD) и возможности его кастомизации. 
  • Альтернативы NPD: их сильные и слабые стороны.
  • Стратегии планирования размещения нагрузки с учетом доменов отказа с целью минимизировать аффект.

Спикеры

Приглашенные эксперты

Расписание