One-cloud: ОС уровня дата-центра в Одноклассниках

День 1 /  / Зал 3  /  RU / Для практикующих инженеров

Одноклассники состоят из более чем восьми тысяч железных серверов, расположенных в нескольких дата-центрах. Каждая из этих машин была специализированной под конкретную задачу (как для обеспечения изоляции отказов, так и для обеспечения автоматизированного управления инфраструктурой).

В определённый момент стало понятно, что внедрение новой системы управления позволит более эффективно загрузить технику, облегчить управление доступами, автоматизировать (пере)распределение вычислительных ресурсов, ускорить запуск новых сервисов, ускорить реакции на масштабные аварии.

Новая система должна объединять под своим управлением все сервера Одноклассников, что, с одной стороны, делает её самой крупной и критичной распределённой системой, а с другой, выдвигает жёсткие требования по обеспечению надёжности её правильного функционирования в любый условиях — особенно при возникновении масштабных отказов и аварий. Это потребовало как тщательного планирования отказоустойчивости, так и особых архитектурных решений.

В данном докладе будет рассказано как о интересных деталях устройства one-cloud, так и об опыте Одноклассников по эксплуатации высоконагруженных Java-приложений в контейнерах.


Скачать презентацию

Наши контакты