Со скоростью кометы: ускоряем Spark без переписывания кода

Со скоростью кометы: ускоряем Spark без переписывания кода

Привет, Хабр! Меня зовут Лев Маковеев. Я младший инженер по обработке данных в компании «Криптонит». В этой статье хочу поделиться с вами результатами небольшого исследования, в ходе которого мы протестировали ускоритель запросов Apache DataFusion Comet и пришли к довольно впечатляющим результатам. Забегая вперёд, отмечу, что в отдельных тестах ускорение было более чем десятикратным! Читать далее

22 апреля 2025, вторник 14:38 Оставить комментарий Источник

Похожие материалы

[Перевод] Потоковая передача данных с помощью Apache Spark и MongoDB

MongoDB объявила о выпуске 10.0 версии коннектора MongoDB для Apache Spark. В этой версии используется новый API Spark Data Sources второй версии (V2) с поддержкой структурированной потоковой передачи данных Spark (Spark Structured Streaming). Зачем нужна новая версия? Текущая версия MongoDB Spark Connector была первоначально…

24 июня 2022, пятница 16:00 Источник
[Перевод] Как дебажить запросы, используя только Spark UI

В этой статье я попытаюсь продемонстрировать, как дебажить задачу Spark, используя только Spark UI. Я запущу несколько задач Spark и покажу, как Spark UI отражает выполнение задачи. Также я поделюсь с вами несколькими советами и хитростями. Читать далее

8 ноября 2020, воскресенье 14:10 Источник
[Перевод] Apache Spark 3.1: Spark on Kubernetes теперь общедоступен

С выходом Apache Spark 3.1 в марте 2021-го проект Spark on Kubernetes официально перешел в статус общедоступного и готового к эксплуатации. Это стало результатом трехлетней работы быстрорастущего сообщества, участники которого помогали в разработке и внедрении (изначально поддержка Spark on Kubernetes

22 апреля 2021, четверг 14:09 Источник

Со скоростью кометы: ускоряем Spark без переписывания кода

Комментарии

Похожие материалы

[Перевод] Потоковая передача данных с помощью Apache Spark и MongoDB

[Перевод] Как дебажить запросы, используя только Spark UI

[Перевод] Apache Spark 3.1: Spark on Kubernetes теперь общедоступен