python html2text.html2text 图片地址换行

python使用html2text,遇到图片的时候图片地址会自动换行导致图片无法正常显示,如何解决?

img


执行之后打印的为图片地址为:

img

  • 这个问题的回答你可以参考下: https://ask.csdn.net/questions/7592247
  • 我还给你找了一篇非常好的博客,你可以看看是否有帮助,链接:python网络数据处理之html2text模块和readability模块学习使用
  • 除此之外, 这篇博客: 【html2text-命令行脚本】Python之html与markdown互相转换中的 命令行脚本代码 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
  • """
    @Author: ZS
    @CSDN  : https://zsyll.blog.csdn.net/
    @Time  : 2021/11/25 12:36
    """
    import html2text
    import os
    import sys
    
    def main():
        # 判断命令行参数是否等于2,
        if len(sys.argv) != 2:
            print("执行命令如下: python xxx.py E:\\Python资料\\test.html")
            return
    
        # 获取终端命令行参数
        path = sys.argv[1]
        if path.endswith('.html'):
            with open(path, encoding='utf-8') as html, open(os.path.splitext(path)[0] + '.md', 'w', encoding='utf-8') as md:
                markdown = html2text.html2text(html.read())
                md.write(markdown)
    
                print(path + ' 转换成功!')
    
    
    if __name__ == '__main__':
        main()
    
    

    示例代码

    python html_to_markdownScript.py C:\Users\Desktop\CSDN素材\test.html
    

    加油!

    感谢!

    努力!

  • 您还可以看一下 武鹏老师的Python编程基础入门课程中的 HTML_2小节, 巩固相关知识点

所啦啦呗,你已经使用beatufulsoup解析了,直接解析图片的url地址就好了。不用html2text