请问要怎样才能解析EPub里的网页文件?我想以纯文本形式打开EPub的里的网页文件并用正则表达式对他们进行修改.

首先,

import ebooklib as 电接#电子书接口
from ebooklib import epub as 电版#电子出版
路径='30天自制操作系统 (川合秀实) (z-lib.org).epub'
实例化的书 = 电版.read_epub(路径)
for 超文本文件 in 实例化的书.get_items_of_type(电接.ITEM_DOCUMENT):
    print(超文本文件)

结果是:

<EpubHtml:inserted:Text/cover_page.xhtml>
<EpubHtml:x_epub.html:Text/part0000.xhtml>

现实是:

import ebooklib as 电接#电子书接口
from ebooklib import epub as 电版#电子出版
路径='30天自制操作系统 (川合秀实) (z-lib.org).epub'
实例化的书 = 电版.read_epub(路径)
for 超文本文件 in 实例化的书.get_items_of_type(电接.ITEM_DOCUMENT):
    print(open(超文本文件).read())

结果:

Traceback (most recent call last):
  File "C:\Users\Administrator\Desktop\活词印刷术.py", line 6, in <module>
    print(open(超文本文件).read())
TypeError: expected str, bytes or os.PathLike object, not EpubHtml

https://github.com/aerkalov/ebooklib/blob/master/ebooklib/epub.py
总得来讲我还有点看不懂源码.

参考:

您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!
PS:问答VIP年卡 【限时加赠:IT技术图书免费领】,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632