[Перевод] Что такое фильтр Блума?

[Перевод] Что такое фильтр Блума?

Всем привет! В этой статье я постараюсь описать, что такое фильтр Блума, рассказать о его назначении и показать сценарии, в которых его можно использовать. Я также реализую фильтр Блума на Python с нуля в целях облегчения понимания его внутреннего устройства. Фильтр Блума. Что это?

9 февраля 2021, вторник 2:53 Оставить комментарий Источник

Похожие материалы

[Перевод] Когда фильтр Блума не подходит

Я ещё с университета знал о фильтре Блума — вероятностной структуре данных, названной в честь Бёртона Блума. Но у меня не было возможности её использовать. В прошлом месяце такая возможность появилась — и эта структура буквально очаровала меня. Впрочем, вскоре я нашёл у неё некоторые недостатки. В этой статье — рассказ о моей краткой любовной связи с фильтром Блума. Читать дальше →

5 марта 2020, четверг 12:04 Источник
ORC in Hive/Spark — “анатомия” файла, индексация и фильтр Блума

ORC in Hive/Spark - “анатомия” файла, индексация и фильтр БлумаORC — это колоночный формат, то есть данные хранятся не по строкам (как в CSV), а по столбцам. Именно это даёт ему способность эффективно сжимать и читать только нужные колонки. Есть ещё встроенная индексация и фильтр Блума, которые позволяют не перелопачивать лишние данные.Давайте заглянем под капот и посмотрим, как устроен ORC-файл, зачем там индексы и как фильтр Блума ускоряет поиск.I. Анатомия файла Читать далее

1 апреля 2026, среда 14:00 Источник
[Перевод] Фильтр Блума

У каждого разработчика есть набор инструментов для решения различных задач. Однако со временем возникает необходимость расширять этот набор, чтобы эффективно справляться с более сложными задачами. В этой статье я хочу познакомить вас с инструментом, которым вы, скорее всего, раньше не пользовались. И хотя он подходит для решения узкого спектра задач, его использование может оказаться весьма полезным. Знакомьтесь — "фильтр Блума" (Bloom filter). Читать дальше →

10 апреля 2024, среда 13:01 Источник

[Перевод] Что такое фильтр Блума?

Комментарии

Похожие материалы

[Перевод] Когда фильтр Блума не подходит

ORC in Hive/Spark — “анатомия” файла, индексация и фильтр Блума

[Перевод] Фильтр Блума