[Перевод] Потоковая передача данных с помощью Apache Spark и MongoDB

[Перевод] Потоковая передача данных с помощью Apache Spark и MongoDB

MongoDB объявила о выпуске 10.0 версии коннектора MongoDB для Apache Spark. В этой версии используется новый API Spark Data Sources второй версии (V2) с поддержкой структурированной потоковой передачи данных Spark (Spark Structured Streaming). Зачем нужна новая версия? Текущая версия MongoDB Spark Connector была первоначально…

24 июня 2022, пятница 16:00 Оставить комментарий Источник

Похожие материалы

Что нового в Apache Spark 4.0

Apache Spark — это мощный фреймворк для распределённой обработки больших объёмов данных, позволяющий выполнять сложные вычисления на кластерах компьютеров с высокой производительностью и гибкостью. И вот 23 мая 2025 года компания Apache выпустила новую версию Spark 4.Стоит отметить, что Apache Spark — масштабный фреймворк с широким функционалом. В данной статье я сосредоточусь на нововведениях, которые в первую очередь затронут пользователей Spark SQL и PySpark. Читать далее

1 июля 2025, вторник 15:30 Источник
[Перевод] Apache Spark 3.1: Spark on Kubernetes теперь общедоступен

С выходом Apache Spark 3.1 в марте 2021-го проект Spark on Kubernetes официально перешел в статус общедоступного и готового к эксплуатации. Это стало результатом трехлетней работы быстрорастущего сообщества, участники которого помогали в разработке и внедрении (изначально поддержка Spark on Kubernetes

22 апреля 2021, четверг 14:09 Источник
[Перевод] Почему лучше НЕ использовать CSV с Apache Spark

Недавно я в очередной раз услышал:“CSV — это популярный формат хранения данных, имеющий встроенную поддержку в Apache Spark…”Ну, на счет “популярный” — согласен, “имеющий встроенную поддержку” — согласен, но на счет “хранения данных” — категорически не согласен. Подобные фразы могут не только сбить с толку окружающих, но и привести к значительным непродуктивным затратам времени (и памяти данных). Давайте разберемся. Читать далее

20 сентября 2021, понедельник 21:55 Источник

[Перевод] Потоковая передача данных с помощью Apache Spark и MongoDB

Комментарии

Похожие материалы

Что нового в Apache Spark 4.0

[Перевод] Apache Spark 3.1: Spark on Kubernetes теперь общедоступен

[Перевод] Почему лучше НЕ использовать CSV с Apache Spark