PDF软件是如何开发的？

我想自己通过python写一个pdf浏览器，在pdf渲染方式上我卡住了。我无法理解，现在的pdf软件是如何渲染pdf文件的，比如wps，能够一页一页地渲染，并且里面的文字我能选中复制，如下图所示。

我查阅了很多文档，不管是PyMuPDF，PyPDF2还是PDFMiner等第三方包，我发现大部分的方法都指向了将pdf的每一页转换成图片，这本身我并不认为是一个好方法。

我最近在读PDF explained这本书，希望能够从中得到答案。在看了一些之后，我想到了一个细思恐极的方法：把PDF语言完全解析：“偏移量”、”页面分隔符“、”文字起止符“和”页面大小“等所有的信息，再将这些内容通过GUI做出来。如果是这样的话，也太顶了吧。

如果有uu们有这方面的经验，希望能解答下我的问题，如果曾经在做PDF的公司任职过就更好了。

那你以为呢
我们不说pdf里面本来就可能是一些图片
我们就说word
它里面是富文本格式
每个字都可以有自己的字体和颜色，还有段落样式
还可以插入图形或者图片
你以为就是简单的文本吗
类似word、excel、adobe这些编辑器，本来就是人家一整个几百人团队花了几年搞出来的玩意，所以才能一套敢卖你几十块钱
你以为自己一个人随随便便就也能搞出一样的玩意吗

以下回答由chatgpt基于相关博客总结生成:
我了解您的问题，目前在Python中实现PDF渲染并实现文本选择和复制还有一些挑战。但是，现有的PDF软件是如何实现这些功能的呢？这些软件通常使用PDF渲染引擎，例如Adobe的Pdfium、Poppler和MuPDF。这些引擎解析PDF文件并将其呈现为图像和文本。您可以调用这些引擎的Python绑定或使用PDF渲染Python库，例如PyMuPDF和pdfminer，在您的项目中实现PDF渲染。
以下是一些步骤，可用于使用PyMuPDF实现PDF的渲染和文本选择：
1.安装PyMuPDF库
pip install PyMuPDF
1. 初始化PDF文档
python import fitz doc = fitz.open(r"path/to/your/pdf/file.pdf")
1. 计算每一页PDF的尺寸
python for page in doc: page_rect = page.rect page_size = (page_rect.width, page_rect.height) # 可以将页尺寸添加到一个列表中，进行后续处理
1. 渲染每一页PDF并将其呈现为图像
python for page in doc: pix = page.get_pixmap() # 可以将图像添加到一个列表中，进行后续处理
1. 获取每一页PDF中的文本
python for page in doc: text = page.get_text("text") # 可以将文本添加到一个列表中，进行后续处理
1. 实现文本选择和复制
您可以通过将文本显示在GUI中，并使用使用Tkinter或PyQT等库的文本选择和复制功能来实现文本选择和复制。
请注意，PDF渲染的性能和可靠性取决于所使用的库和引擎，因此您可能需要进行一些基准测试和优化。
希望这些步骤可以帮助您开始实现PDF浏览器。如果您需要更详细的代码示例或探讨其他PDF渲染库和工具，请告诉我。