Проверка содержимого PDF-файлов средствами Python и pdfminer. Часть 2

Проверка содержимого PDF-файлов средствами Python и pdfminer. Часть 2

В предыдущей части статьи мы рассмотрели общие подходы к тестированию PDF и познакомились с тем, как библиотеки pdfminer и PDFQuery помогают нам получать детальную информацию об объектах. Достаточно ли нам этой информации? Далеко не всегда. В этой статье мы расскажем о решении некоторых интересных технических проблем. Читать далее

1 октября 2024, вторник 14:17 Оставить комментарий Источник

Похожие материалы

Проверка содержимого PDF-файлов средствами Python и pdfminer. Часть 1

Некоторое время назад у нас появился интересный проект по созданию сервиса, генерирующего документы в формате PDF. И появилась задача — написать тесты, которые проверят документ в мельчайших деталях, включая и содержимое, и вёрстку. В данной статье мы расскажем, каким образом справились с этой задачей. Читать далее

18 сентября 2024, среда 15:02 Источник
Работа с pdf-файлами с помощью библиотеки fitz

Возникла идея создать небольшую утилиту на Python, которая будет парсить PDF и сверять со списком швов, взятых из BIM модели. Изначально я обратился к библиотеке pdfminer, вернее к ее форку pdfminer.six. Но скорость работы меня совершенно не устраивала. Вот, например, загрузка файла в 10 страниц и парой картинок. Читать далее

14 сентября 2021, вторник 12:31 Источник
[Перевод] Небезопасная загрузка файлов: полное руководство по поиску продвинутых уязвимостей при загрузке файлов

Содержание- Что такое уязвимости загрузки файлов?- Выявление уязвимостей при загрузке файлов- Эксплуатация простых уязвимостей загрузки файлов- Продвинутая эксплуатация уязвимостей при загрузке файлов- ЗаключениеУязвимости в загрузки файлов интересны для поиска, они по…

17 декабря 2024, вторник 13:10 Источник

Проверка содержимого PDF-файлов средствами Python и pdfminer. Часть 2

Комментарии

Похожие материалы

Проверка содержимого PDF-файлов средствами Python и pdfminer. Часть 1

Работа с pdf-файлами с помощью библиотеки fitz

[Перевод] Небезопасная загрузка файлов: полное руководство по поиску продвинутых уязвимостей при загрузке файлов