Вы строите Lakehouse, а сторадж строит вам проблемы. Что делать?

Вы строите Lakehouse, а сторадж строит вам проблемы. Что делать?

Всем привет! Меня зовут Дмитрий Листвин, я занимаюсь аналитическим хранилищем данных в Авито. В этой статье я собрал наш опыт построения Lakehouse поверх объектного хранилища, как реальная аналитическая нагрузка быстро превращает «обычный S3» в самый капризный элемент всей архитектуры. Будет много про извлечение максимума производительности из Ceph: как добиться высокой пропускной способности HDD, когда поверх данных хочется запускать тяжёлые аналитические запросы. Читать далее

28 декабря 2025, воскресенье 14:17 Оставить комментарий Источник

Похожие материалы

Data Mesh, Data Fabric, Lakehouse: разбираем модные термины

Data Mesh, Data Fabric, Lakehouse: разбираем модные терминыData Mesh, Fabric, Lakehouse – все говорят, но никто толком не объясняет, чем они отличаются и можно ли их использовать вместе. Разобралась и делюсь структурированно и без воды.➕ Сравнительная таблица и чек-лист: что выбрать под свою боль.✔️Сохраняйте, чтобы больше никогда не путаться. Читать далее

28 февраля 2026, суббота 21:33 Источник
StarRocks 4.0: Real-Time Intelligence on Lakehouse

StarRocks 4.0: Real‑Time Intelligence on Lakehouse. Сквозная оптимизация конвейера в реальном времени, 3–15× ускорение JSON, SQL Plan Manager, Decimal256 и поддержка Apache Iceberg для нативной Lakehouse‑аналитики. Читать далее

4 декабря 2025, четверг 6:49 Источник
Гид по Cloudberry ч.2: advanced-возможности, дорожная карта и планы развития

В прошлый раз, в первой части нашего гида по Apache Cloudberry™, мы поговорили об истории проекта, его архитектуре, ядре СУБД и функциях платформы. Но помимо ядра СУБД, мы также хотим использовать data‑lakehouse‑запросы. В Data Lakehouse есть некоторые проблемы: мы не можем…

20 октября 2025, понедельник 9:00 Источник

Вы строите Lakehouse, а сторадж строит вам проблемы. Что делать?

Комментарии

Похожие материалы

Data Mesh, Data Fabric, Lakehouse: разбираем модные термины

StarRocks 4.0: Real-Time Intelligence on Lakehouse

Гид по Cloudberry ч.2: advanced-возможности, дорожная карта и планы развития