找回密码
 会员注册
查看: 32|回复: 0

通过Python的fitz库提取pdf中的图片

[复制链接]

2万

主题

0

回帖

6万

积分

超级版主

积分
64083
发表于 2024-9-13 15:04:00 | 显示全部楼层 |阅读模式
文章目录前言一、fitz库是什么?二、安装fitz库三、查看fitz库版本四、pymupdf库是什么?五、安装pymupdf库六、查看pymupdf库版本七、fitz和pymupdf是什么关系?八、提取pdf中的图片1.引入库2.定义pdf路径3.打开PDF文件4.遍历所有页面5.获取页面上所有图像6.遍历所有图像7.获取图像的XREF编号和图像数据8.如果图像是RGB颜色空间,则保存为PNG文件总结pdf提取图片效果前言大家好,我是空空star,本篇给大家分享一下《通过Python的fitz库提取pdf中的图片》。一、fitz库是什么?Fitz库是一个Python图像处理库,主要用于打开、编辑和保存PDF、TIFF和JPEG格式的图像。它可以帮助用户读取和写入PDF文件,提取PDF页面以及在页面上进行标记和注释。此外,Fitz库还提供了一些图像处理功能,如旋转、裁剪、缩放、调整亮度、对比度和色彩平衡等。这些功能使得Fitz库成为一个非常实用的图像处理工具。二、安装fitz库pipinstallfitz1三、查看fitz库版本pipshowfitz1Name:fitzVersion:0.0.1.dev2Summary:Fitz:WorkflowMangementforneuroimagingdata.Home-page:http://github.com/kastman/fitzAuthor:ErikKastmanAuthor-email:erik.kastman@gmail.comLicense:BSD(3-clause)Requires:configobj,configparser,httplib2,nibabel,nipype,numpy,pandas,pyxnat,scipyRequired-by:四、pymupdf库是什么?使用fitz,需要安装pymupdf库。PyMuPDF是一个基于Python的开源PDF处理库,提供了一系列的PDF文档处理功能,如读取、编辑、创建、转换等。它是MuPDF的Python绑定,MuPDF是一款轻量级的开源PDF文档渲染引擎,支持多种平台和多种文件格式。PyMuPDF具有快速、高效、简单易用等特点,可以用于PDF文档的自动化处理和批量处理,比如提取文本、提取图片、添加或修改书签、添加或修改注释、合并PDF文件、切割PDF文件、提取PDF页面等。同时,它还支持PDF渲染成图片,方便快速预览和生成缩略图。总之,PyMuPDF是一个非常实用的PythonPDF处理库,适用于多种场景,如数据处理、文档处理、自动化办公等。五、安装pymupdf库pipinstallpymupdf1六、查看pymupdf库版本pipshowpymupdf1NameyMuPDFVersion:1.22.3SummaryythonbindingsforthePDFtoolkitandrendererMuPDFHome-page:https://github.com/pymupdf/PyMuPDFAuthor:ArtifexAuthor-email:support@artifex.comLicense:GNUAFFEROGPL3.0Requires:Required-by:七、fitz和pymupdf是什么关系?fitz是Pymupdf库的一个模块,它是Pymupdf的主要模块之一,也是最常用的模块。fitz模块提供了对PDF文档的基本操作,如打开、读取、编辑、保存等。八、提取pdf中的图片1.引入库importfitz12.定义pdf路径local='/Users/kkstar/Downloads/'1'运行运行3.打开PDF文件pdf_doc=fitz.open(local+'demo_pic.pdf')14.遍历所有页面forpginrange(pdf_doc.page_count):page=pdf_doc[pg]125.获取页面上所有图像image_list=page.get_images()16.遍历所有图像forimginimage_list:17.获取图像的XREF编号和图像数据xref=img[0]pix=fitz.Pixmap(pdf_doc,xref)128.如果图像是RGB颜色空间,则保存为PNG文件ifstr(fitz.csRGB)==str(pix.colorspace):img_path=local+f'image{pg+1}_{xref}.png'pix.save(img_path)123总结pdf提取图片效果
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2024-12-26 11:39 , Processed in 0.491259 second(s), 26 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表