При веб парсинге сайтов рано или поздно приходится сталкиваться с механизмами защиты от ботов. Сайты могут блокировать массовые запросы по IP-адресу, выдавать сложные капчи или применять другие антибот меры. Я хочу рассмотреть как реализовать на Python парсинг сайта с обходом таких защит: Читать далее
В последнее время все чаще звучат идеи — что капча переоценена, и что развитие ИИ технологий медленно но верно убивает индустрию сервисов распознавания капчи. «Нейросеть научилась решать капчу лучше человека», «сервисы распознавания капчи все», «ИИ решает капчу быстрее человека» и так далее в том же духе. А давайте разберемся в этом чуть глубже — есть ощущение, что не все так однозначно, как кажется на первый взгляд. Читать далее
В предыдущей статье - Распознавание капчи токеном или кликами, что быстрее? Сравнение методов на практике (я ее кстати опубликовал еще и на DTF) я сравнил два метода обхода капчи (кликами и токеном) но с использованием Puppeteer, и анонсировал, что в следующей статье (то есть уже в этой) сделаю практическое сравнение этих же двух методов, но уже с использованием selenium и обход капчи будем считать завершенным. Полная картина, так сказать сложится. Ну… Не будем тянуть, переходим сразу к делу. Читать далее
CAPTCHA-протоколы призваны отличать ботов от людей, однако в мире автоматизации и тестирования часто возникает необходимость эти капчи обходить. Существуют специальные сервисы распознавания капчи, которые берут на себя решение этих задач с помощью сочетания алгоритмов и…