[Перевод] Оптимальное расположение шардов в петабайтном кластере Elasticsearch: линейное программирование

[Перевод] Оптимальное расположение шардов в петабайтном кластере Elasticsearch: линейное программирование

В самом сердце информационно-поисковых систем Meltwater и Fairhair.ai работает набор кластеров Elasticsearch с миллиардами статей из СМИ и социальных медиа. Индексные шарды в кластерах сильно отличаются по структуре доступа, рабочей нагрузке и размеру, что поднимает некоторые очень…

13 ноября 2018, вторник 18:23 Оставить комментарий Источник

Похожие материалы

Elasticsearch: сайзинг шардов как завещал Elastic + анонс вебинара + предложения по митапу

Каждый индекс Elasticsearch состоит из шардов. Шарды — это логическое и физическое разделение индекса. В этой статье мы расскажем о сайзинге шардов Elasticsearch — важной его части, серьёзно влияющей на производительность кластера. В высоконагруженных системах выбор правильной конфигурации архитектуры хранения позволит серьёзно сэкономить на железе. Бóльшая часть статьи основана на соответствующем разделе документации Elastic. Подробности под катом. Читать дальше →

15 марта 2021, понедельник 22:12 Источник
[Перевод] Мой любимый алгоритм: нахождение медианы за линейное время

Нахождение медианы списка может казаться тривиальной задачей, но её выполнение за линейное время требует серьёзного подхода. В этом посте я расскажу об одном из самых любимых мной алгоритмов — нахождении медианы списка за детерминированное линейное время с помощью медианы медиан. Хотя доказательство того, что этот алгоритм выполняется за линейное время, довольно сложно, сам пост будет понятен и читателям с начальным уровнем знаний об анализе алгоритмов. Читать дальше →

20 января 2018, суббота 12:18 Источник
Ровняем шарды

"Размышления без практики приводят к заблуждению, практика без размышления приводит к затруднению." Мы ведём войну с индивидуальностью у шардов в кластере MongoDB. Это продолжение статьи Шардинг от которого невозможно отказаться, а это значит, что наступила пора конкретики. Как я и обещал, здесь мы рассмотрим подробнее: настройку процесса выравнивания размера шардов расчет поправок для коррекции границ мониторинг распределения данных в коллекциях Читать дальше →

13 мая 2021, четверг 11:18 Источник

[Перевод] Оптимальное расположение шардов в петабайтном кластере Elasticsearch: линейное программирование

Комментарии

Похожие материалы

Elasticsearch: сайзинг шардов как завещал Elastic + анонс вебинара + предложения по митапу

[Перевод] Мой любимый алгоритм: нахождение медианы за линейное время

Ровняем шарды