Сложная агрегация в Pandas с MultiIndex

Сложная агрегация в Pandas с MultiIndex

Сегодня поговорим о Pandas MultiIndex — мощной штуке, которая спасла меня, когда пришлось агрегировать кучу многомерных данных. В отчётах за несколько лет с миллионами строк, обычный groupby() просто не справлялся, а MultiIndex сделал всё красиво и быстро. Разберём, как использовать его для сложных операций, не тратя лишнего времени. Читать далее

23 сентября 2024, понедельник 9:09 Оставить комментарий Источник

Похожие материалы

Pandas НЕ для анализа данных

В среде питонистов библиотека Pandas пользуется большой популярностью и по большей мере известна в контексте DataSciense и анализа данных. DataFrame пандас позволяет не только всячески манипулировать данными, но и выводить их в нужном формате, предоставляя широкие возможности для кастомизации. Например, использовали ли вы объекты класса Styler, входящего в состав Pandas? Мне показалось интересным взглянуть на Pandas с этой стороны. Читать далее

18 июня 2024, вторник 23:11 Источник
Открытый курс машинного обучения. Тема 1. Первичный анализ данных с Pandas

Старт открытого курса OpenDataScience Привет всем, кто ждал запуска открытого курса по практическому анализу данных и машинному обучению! Первая статья посвящена первичному анализу данных с Pandas. Пока в серии планируется 7 статей, идущих вместе с тетрадками Jupyter (репозиторий mlcourse_open), соревнованиями и домашними заданиями. Далее идет список будущих статей, описание курса и собственно, первая тема – введение в Pandas. Читать дальше →

28 февраля 2017, вторник 14:45 Источник
[Перевод] 5 малоизвестных секретов Pandas

Pandas не нуждается в представлении: на сегодняшний день это главный инструмент для анализа данных на Python. Я работаю специалистом по анализу данных, и несмотря на то, что пользуюсь pandas каждый день, не перестаю удивляться разнообразию функционала этой библиотеки. В этой статье я…

16 марта 2020, понедельник 14:13 Источник

Сложная агрегация в Pandas с MultiIndex

Комментарии

Похожие материалы

Pandas НЕ для анализа данных

Открытый курс машинного обучения. Тема 1. Первичный анализ данных с Pandas

[Перевод] 5 малоизвестных секретов Pandas