我爱占星网 我爱占星网
首页
编程
java
php
前端
首页 编程 java php 前端

网抓遇到多个网抓遇到一个页面有多个<html> </html>

网抓遇到不规范的网页,一个网页里面有多个 该咋办,BeautifulSoup只会处理第一个 的内容

没问题吧?

img

from bs4 import BeautifulSoup
s='''
<html><a>aa</a></html>
<html><a>bb</a></html>
'''

soup=BeautifulSoup(s,'html.parser')
print(soup.select('a'))

近期文章

  • 使用Linux多线程的报错,
  • 如何用MATLAB app switch开关控制一个Gauge控件自己运动
  • 运行unity中的SRWork包出现 unity has stopped working怎么回事?
  • C语言编程问题求解答
  • 爬虫,求友友指点迷津
  • C语言编程问题求解答
  • vue 中 van-button 第一行显示俩个字 剩下的都在下一行显示
  • 为什么是我看到的好多都是head后缀不是a啊?
  • 用指针函数完成strlen的功能
  • Transfer-encoding header already present
  • 请各位解惑(Java)
  • CSS为什么我创造出来的盒子尺寸和实际的盒子尺寸不一样
  • 用KNN算法对MNIST数据集和Fashion-Mnist数据集进行分类。
  • unity Xcode 编译报错
  • 正则表达式匹配c++基础题
  • 求解令你了不会啊……
  • python执行语句
  • vue3如何把请求到的数据添加到另外一个const中?
  • 编写算法,求下图任意两个顶点间的最短路径。
  • C++ 向main函数传递参数进行debug

Copyright ©2022 我爱占星 All Rights Reserved.

浙ICP备2022030071号-1

部分图文来自网络,如有侵犯您的版权,请告诉我们删除

友情链接:代码精华