Подпишитесь на мой канал на YouTube, где я регулярно публикую новые видео.

Добавляйтесь ко мне в друзья ВКонтакте! Отзывы о сайте и обо мне оставляйте в моей группе.

Мой аккаунт Моя группа

Какая тема Вас интересует больше?

Программирование на Python для начинающих

Бесплатный курс по Python даст Вам всю необходимую базу для начала программирования на языке Python. В курсе Вас ждёт множество уроков (больше 4-х часов видео), исходников и упражнений.

Чтобы получить Видеокурс,
заполните форму

Другие курсы

Как стать высокооплачиваемым Unreal-разработчиком: пошаговая инструкция

После семинара:

- Вы узнаете, что нужно делать, чтобы устроиться на работу Unreal-разработчиком.

- Вы узнаете, что нужно изучить, чтобы стать Unreal-разработчиком.

- Вы получите PDF-файл с чек-листом с пошаговым планом.

- Вы узнаете, как ускорить весь процесс в 3-4 раза.

Записаться

Другие курсы

Если хочешь, чтобы твои сны сбывались, поменьше спи.

Неизвестный

Конвертация страниц PDF в изображения с помощью PyMuPDF

Работа с PDF-документами часто требует их преобразования в другие форматы, такие как изображения. Это может быть полезно для архивирования, создания галерей или просто для удобства просмотра. В этой статье мы рассмотрим, как с помощью библиотеки PyMuPDF можно легко конвертировать страницы PDF в изображения JPEG.

Подготовка

Для начала нам потребуется установить библиотеку PyMuPDF. Это можно сделать с помощью команды:

pip install pymupdf

Описание скрипта

Рассмотрим следующий скрипт на Python, который осуществляет конвертацию страниц PDF-документа в изображения.

import fitz  # PyMuPDF



# Открываем PDF файл

input_pdf_path = "files/catalog_2023.pdf"

pdf_document = fitz.open(input_pdf_path)



# Установим разрешение (например, 300 DPI)

zoom_x = 3.0  # горизонтальное увеличение

zoom_y = 3.0  # вертикальное увеличение

matrix = fitz.Matrix(zoom_x, zoom_y)



# Проходим по всем страницам и сохраняем каждую страницу как JPEG изображение

for page_number in range(len(pdf_document)):

   # Извлекаем страницу

   page = pdf_document.load_page(page_number)

   # Конвертируем страницу в изображение (массив пикселей)

   pix = page.get_pixmap(matrix=matrix)

   # Сохраняем изображение в файл

   output_image_path = f"images/page_{page_number + 1}.jpg"

   pix.save(output_image_path)



   print(output_image_path)



# Закрываем оригинальный PDF документ

pdf_document.close()

Разбор кода

Импорт библиотеки:

import fitz  # PyMuPDF

PyMuPDF предоставляет мощные инструменты для работы с PDF и изображениями. Мы импортируем её под псевдонимом fitz.

Открытие PDF-файла:

input_pdf_path = "files/catalog_2023.pdf"

pdf_document = fitz.open(input_pdf_path)

Указываем путь к нашему PDF-документу и открываем его с помощью fitz.open().

Установка разрешения:

zoom_x = 3.0  # горизонтальное увеличение

zoom_y = 3.0  # вертикальное увеличение

matrix = fitz.Matrix(zoom_x, zoom_y)

Для получения изображений высокого качества, устанавливаем коэффициенты увеличения по горизонтали и вертикали. В данном случае, увеличение в 3 раза соответствует разрешению примерно 300 DPI (dots per inch).

Конвертация страниц в изображения:

for page_number in range(len(pdf_document)):

   page = pdf_document.load_page(page_number)

   pix = page.get_pixmap(matrix=matrix)

   output_image_path = f"images/page_{page_number + 1}.jpg"

   pix.save(output_image_path)

   print(output_image_path)

Проходим по всем страницам PDF-документа, извлекаем каждую страницу и конвертируем её в изображение с помощью метода get_pixmap(). Сохраняем каждое изображение в формате JPEG в указанную директорию.

Закрытие PDF-документа:

pdf_document.close()

После завершения всех операций закрываем оригинальный PDF-документ для освобождения ресурсов.

Заключение

С помощью библиотеки PyMuPDF можно легко и быстро конвертировать страницы PDF-документов в изображения высокого качества. Такой подход может быть полезен для различных задач, начиная от создания предварительных просмотров документов до их архивирования в виде изображений.

А для большего погружения в тему у меня для Вас есть видеокурс Программирование на Python с Нуля до Гуру.

Создано 23.07.2024 08:21:47
Михаил Русаков

Предыдущая статья Следующая статья

Копирование материалов разрешается только с указанием автора (Михаил Русаков) и индексируемой прямой ссылкой на сайт (https://myrusakov.ru)!

Добавляйтесь ко мне в друзья ВКонтакте: https://vk.com/myrusakov.
Если Вы хотите дать оценку мне и моей работе, то напишите её в моей группе: https://vk.com/rusakovmy.

Если Вы не хотите пропустить новые материалы на сайте,
то Вы можете подписаться на обновления: Подписаться на обновления

Если у Вас остались какие-либо вопросы, либо у Вас есть желание высказаться по поводу этой статьи, то Вы можете оставить свой комментарий внизу страницы.

Если Вам понравился сайт, то разместите ссылку на него (у себя на сайте, на форуме, в контакте):

Кнопка:
<a href="https://myrusakov.ru" target="_blank"><img src="https://myrusakov.ru/images/button.gif" style="border: 0; height: 31px; width: 88px;" alt="Как создать свой сайт" /></a>
Она выглядит вот так:
Текстовая ссылка:
<a href="https://myrusakov.ru" target="_blank">Как создать свой сайт</a>
Она выглядит вот так: Как создать свой сайт
BB-код ссылки для форумов (например, можете поставить её в подписи):
[URL="https://myrusakov.ru"]Как создать свой сайт[/URL]

Комментарии (0):

Для добавления комментариев надо войти в систему.
Если Вы ещё не зарегистрированы на сайте, то сначала зарегистрируйтесь.

<MyRusakov.ru />

Разработчик игр на Unreal Engine