Ускорить Pandas в 60 раз: проверяем лайфхаки из интернета на реальном проекте и обкладываемся бенчмарками

Ускорить Pandas в 60 раз: проверяем лайфхаки из интернета на реальном проекте и обкладываемся бенчмарками

Привет! Если после заголовка вы решили, что это очередная статья в стиле «Топ-10 способов ускорить Pandas», то не торопитесь с выводами. Вместо топов и подборок предлагаю взглянуть на бенчмарки скорости и потребления памяти в зависимости от характеристик датафрейма и убедиться, что часть советов из статей по ускорению могут оказаться даже вредными. Разберём, какой из способов ускорения нужно пробовать в разных ситуациях, как это зависит от размера датафрейма и как ведёт себя в реальном проекте. Читать далее

17 апреля 2025, четверг 15:25 Оставить комментарий Источник

Похожие материалы

[Перевод] 6 способов значительно ускорить pandas с помощью пары строк кода. Часть 2

В предыдущей статье мы с вами рассмотрели несколько несложных способов ускорить Pandas через jit-компиляцию и использование нескольких ядер с помощью таких инструментов как Numba и Pandarallel. В этот раз мы поговорим о более мощных инструментах, с помощью которых можно не только ускорить pandas, но и кластеризовать его, таким образом позволив обрабатывать большие данные. Часть 1: Numba Multiprocessing Pandarallel Часть 2: Swifter Modin Dask Читать дальше →

27 мая 2020, среда 15:45 Источник
Малюсенький CI вашего Symfony проекта за 2 минуты

Без воды о том, как за 10 минут сделать: 1.Проверяем ваш composer.json на серьезные и несерьезные ошибки, вроде неоптимального autoload 2.Проверяем ваш composer.lock на security уязвимости в пакетах 3.Проверяем вашу базу данных, что ничего не забыли 4.Проверяем ваши YAML файлы 5.Проверяем Coding Style по Symfony Читать дальше →

20 января 2018, суббота 2:29 Источник
Pandas НЕ для анализа данных

В среде питонистов библиотека Pandas пользуется большой популярностью и по большей мере известна в контексте DataSciense и анализа данных. DataFrame пандас позволяет не только всячески манипулировать данными, но и выводить их в нужном формате, предоставляя широкие возможности для кастомизации. Например, использовали ли вы объекты класса Styler, входящего в состав Pandas? Мне показалось интересным взглянуть на Pandas с этой стороны. Читать далее

18 июня 2024, вторник 23:11 Источник

Ускорить Pandas в 60 раз: проверяем лайфхаки из интернета на реальном проекте и обкладываемся бенчмарками

Комментарии

Похожие материалы

[Перевод] 6 способов значительно ускорить pandas с помощью пары строк кода. Часть 2

Малюсенький CI вашего Symfony проекта за 2 минуты

Pandas НЕ для анализа данных