[Туториал] Пишем собственные Spark Native Functions (Часть 2)

[Туториал] Пишем собственные Spark Native Functions (Часть 2)

В предыдущей своей статье Почему стоит начать писать собственные Spark Native Functions? (Часть 1), которая является переводом и которая вдохновила меня на собственные изыскания, был разобран пример, как написать свою Spark Native Function по генерации UID. Это, конечно, здорово, но вот только данная…

4 июня 2024, вторник 9:41 Оставить комментарий Источник

Похожие материалы

[Перевод] [Перевод] Почему стоит начать писать собственные Spark Native Functions?

Это мой вольный перевод статьи "Why You Should Start Writing Spark Custom Native Functions", которая вдохновила меня на некоторые собстенные изыскания по данной теме. Их результат я планирую опубликовать позже, а пока выношу на ваш суд этот перевод.Статья на примере реализации функции по генератации UUID…

24 апреля 2024, среда 14:34 Источник
[Перевод] Потоковая передача данных с помощью Apache Spark и MongoDB

MongoDB объявила о выпуске 10.0 версии коннектора MongoDB для Apache Spark. В этой версии используется новый API Spark Data Sources второй версии (V2) с поддержкой структурированной потоковой передачи данных Spark (Spark Structured Streaming). Зачем нужна новая версия? Текущая версия MongoDB Spark Connector была первоначально…

24 июня 2022, пятница 16:00 Источник
Что нового в Apache Spark 4.0

Apache Spark — это мощный фреймворк для распределённой обработки больших объёмов данных, позволяющий выполнять сложные вычисления на кластерах компьютеров с высокой производительностью и гибкостью. И вот 23 мая 2025 года компания Apache выпустила новую версию Spark 4.Стоит отметить, что Apache Spark — масштабный фреймворк с широким функционалом. В данной статье я сосредоточусь на нововведениях, которые в первую очередь затронут пользователей Spark SQL и PySpark. Читать далее

1 июля 2025, вторник 15:30 Источник

[Туториал] Пишем собственные Spark Native Functions (Часть 2)

Комментарии

Похожие материалы

[Перевод] [Перевод] Почему стоит начать писать собственные Spark Native Functions?

[Перевод] Потоковая передача данных с помощью Apache Spark и MongoDB

Что нового в Apache Spark 4.0