Многие уверены, что если сервис поднят в кластере — значит, он защищён от любых потрясений инфраструктуры, и, если что-то случится, Kubernetes "сам всё поднимет". Но на деле есть нюанс. Реальная устойчивость и грамотный disaster recovery появляются только на стыке платформы, клиентской логики…
Фото Carles Rabada, Unsplash.com Мы заскейлили кластер Kubernetes до 7500 нод, создав масштабируемую архитектуру для крупных моделей, вроде GPT-3, CLIP и DALL·E, и для небольших итеративных исследований, например, законов масштабирования для нейронных моделей языка. Кластер Kubernetes такого размера — редкость, и действовать нужно осторожно, зато мы получили простую инфраструктуру, в которой специалисты по машинному обучению работают быстрее и могут масштабироваться без изменения кода. Читать дальше →
Лучшие практики Kubernetes. Создание небольших контейнеров Лучшие практики Kubernetes. Организация Kubernetes с пространством имен Лучшие практики Kubernetes. Проверка жизнеспособности Kubernetes с помощью тестов Readiness и Liveness Лучшие практики Kubernetes. Настройка запросов и лимитов ресурсов Лучшие…
Учения «Безопасное небо – 2014» пройдут в мае и июне. Об этом сообщило Министерство обороны Украины. В мае-июне текущего года воздушные силы страны проведут широкомасштабные учения с привлечением самолетов МиГ-29, Су-27 ВС Украины и самолетов МиГ-29 и F-16 ВВС Республики Польша. Об этом