Оптимизация обработки данных: как мы перестроили пайплайн с Apache Iceberg и S3

Оптимизация обработки данных: как мы перестроили пайплайн с Apache Iceberg и S3

Исходная задача и контекстПеред нами стояла типичная для дата‑инженеров задача: обработать поток Parquet‑файлов с данными о внутренних технических процессах заказчика. Ключевой запрос — извлечь метаданные из таблицы, чтобы в дальнейшем работать с ними быстрее и удобнее.В качестве основного инструмента мы выбрали Apache Iceberg — проверенный в наших проектах фреймворк для управления метаданными. Изначально пайплайн выглядел так: Читать далее

11 февраля 2026, среда 13:27 Оставить комментарий Источник

Похожие материалы

Ножи ICEBERG-130(R) для V2.0/V3.0 «Мокрый лёд», правое вращение NLA-130R.ML

Ножи к ледобуру ICEBERG 130R имеют радиусную форму и подходят к ледобурам ICEBERG v2.0 и ICEBERG v3.0 с правым вращением и диаметром бурения 130 мм.Благодаря специальному углу заточки ножа, обеспечивается лёгкое бурение сырого льда. Отсутствие резких углов в радиусной форме ножа обеспечивает плавное сверление при минимальном усилии.Технологии производства ножейПроизводятся при помощи высокотехнологичного итальянского шлифовального оборудования […]

14 февраля 2025, пятница 2:46 Источник
Неочевидные оптимизации Iceberg таблиц

Iceberg становится де-факто отраслевым стандартом при построении lakehouse в России. Для сравнения, на последней конференции smart-data, Iceberg по частоте упоминания уступает только Spark. Это значит, что уверенное владение механикой работы Iceberg становится обязательным навыком для инженеров…

24 марта 2026, вторник 8:09 Источник
Оптимизация производительности запросов: мощный тандем StarRocks и Apache Iceberg

Apache Iceberg — табличный формат для озёр данных с поддержкой ACID, Schema Evolution, Hidden Partition и версионирования, но при больших метаданных и работе через S3 страдает планирование запросов и латентность. В связке со StarRocks мы показываем, как распределённый Job Plan, Manifest Cache, CBO с гистограммами, Data Cache…

5 ноября 2025, среда 15:54 Источник

Оптимизация обработки данных: как мы перестроили пайплайн с Apache Iceberg и S3

Комментарии

Похожие материалы

Ножи ICEBERG-130(R) для V2.0/V3.0 «Мокрый лёд», правое вращение NLA-130R.ML

Неочевидные оптимизации Iceberg таблиц

Оптимизация производительности запросов: мощный тандем StarRocks и Apache Iceberg