commit cbee9c9b67d31540211c1cb7377f8d265e05bad8 Author: chenwei <3291673014@qq.com> Date: Mon Apr 15 16:12:52 2024 +0800 读取PDF文档内容 diff --git a/src/devUtil/pdfUtil/PdfUtil.java b/src/devUtil/pdfUtil/PdfUtil.java new file mode 100644 index 0000000..61bd60b --- /dev/null +++ b/src/devUtil/pdfUtil/PdfUtil.java @@ -0,0 +1,41 @@ +package devUtil.pdfUtil; + +import java.io.File; +import java.io.IOException; + +import org.apache.pdfbox.pdmodel.PDDocument; +import org.apache.pdfbox.text.PDFTextStripper; + + +/** + * 关于PDF的一些工具 + */ +public class PdfUtil { + + /** + * 获取PDF中的文字 + */ + public String getPdfCharacter(String filePath, String fileName) { + String result = ""; + try { + // 加载PDF文档 + PDDocument document = PDDocument.load(new File(filePath + File.separator + fileName)); + + // 创建一个PDF文本提取器 + PDFTextStripper pdfStripper = new PDFTextStripper(); + + // 提取文本 + result = pdfStripper.getText(document); + + // 关闭文档 + document.close(); + + } catch (IOException e) { + e.printStackTrace(); + } + + return result; + } + + +}