请问要怎样才能解析EPub里的网页文件?我想以纯文本形式打开EPub的里的网页文件并用正则表达式对他们进行修改.

首先,

import ebooklib as 电接#电子书接口
from ebooklib import epub as 电版#电子出版
路径='30天自制操作系统 (川合秀实) (z-lib.org).epub'
实例化的书 = 电版.read_epub(路径)
for 超文本文件 in 实例化的书.get_items_of_type(电接.ITEM_DOCUMENT):
    print(超文本文件)

结果是:

<EpubHtml:inserted:Text/cover_page.xhtml>
<EpubHtml:x_epub.html:Text/part0000.xhtml>

现实是:

import ebooklib as 电接#电子书接口
from ebooklib import epub as 电版#电子出版
路径='30天自制操作系统 (川合秀实) (z-lib.org).epub'
实例化的书 = 电版.read_epub(路径)
for 超文本文件 in 实例化的书.get_items_of_type(电接.ITEM_DOCUMENT):
    print(open(超文本文件).read())

结果:

Traceback (most recent call last):
  File "C:\Users\Administrator\Desktop\活词印刷术.py", line 6, in <module>
    print(open(超文本文件).read())
TypeError: expected str, bytes or os.PathLike object, not EpubHtml

https://github.com/aerkalov/ebooklib/blob/master/ebooklib/epub.py
总得来讲我还有点看不懂源码.

参考：

Python 电子书库 EbookLib | 码农软件 - 码农网 EbookLib 是一个 Python 电子书库，用于处理 EPUB2 / EPUB3 和 Kindle 格式的图书。它能够以编程方式阅读和编写 EPUB 文件（Kindle支持正在开发中）。 EbookLib 的 API 被设计为尽可能简单，同时使复杂的事情也变得可能。它支持封面、目录、...

https://www.codercto.com/soft/d/11396.html

您好，我是有问必答小助手，您的问题已经有小伙伴帮您解答，感谢您对有问必答的支持与关注！
PS：问答VIP年卡【限时加赠：IT技术图书免费领】，了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632