Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов

Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов

В этой статье мы делимся опытом оптимизации Spark-кода на реальных задачах: рассказываем, как с помощью ручного и автоматического репартицирования ускорить обработку данных, как правильно настраивать оконные функции и запускать множество небольших Spark-приложений внутри одного…

15 мая 2025, четверг 14:01 Оставить комментарий Источник

Похожие материалы

[Перевод] Потоковая передача данных с помощью Apache Spark и MongoDB

MongoDB объявила о выпуске 10.0 версии коннектора MongoDB для Apache Spark. В этой версии используется новый API Spark Data Sources второй версии (V2) с поддержкой структурированной потоковой передачи данных Spark (Spark Structured Streaming). Зачем нужна новая версия? Текущая версия MongoDB Spark Connector была первоначально…

24 июня 2022, пятница 16:00 Источник
Pydantic 2: Полное руководство для Python-разработчиков — от основ до продвинутых техник

Друзья, сегодня мы погрузимся в мир Pydantic 2 – мощного инструмента для валидации данных в Python! Узнаем, почему эта библиотека стала незаменимой в 30% Python-проектов и как она упрощает работу с данными. От базовых концепций до продвинутых техник – мы охватим всё, что нужно знать современному Python-разработчику. Готовьтесь к практике – ведь только так можно по-настоящему освоить Pydantic и сделать ваш код более надёжным и эффективным. Читать далее

18 октября 2024, пятница 15:16 Источник
[Перевод] Как дебажить запросы, используя только Spark UI

В этой статье я попытаюсь продемонстрировать, как дебажить задачу Spark, используя только Spark UI. Я запущу несколько задач Spark и покажу, как Spark UI отражает выполнение задачи. Также я поделюсь с вами несколькими советами и хитростями. Читать далее

8 ноября 2020, воскресенье 14:10 Источник

Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов

Комментарии

Похожие материалы

[Перевод] Потоковая передача данных с помощью Apache Spark и MongoDB

Pydantic 2: Полное руководство для Python-разработчиков — от основ до продвинутых техник

[Перевод] Как дебажить запросы, используя только Spark UI