我爱占星网 我爱占星网
首页
编程
java
php
前端
首页 编程 java php 前端

python爬取网站时抓不到网站源代码?

爬取这个网站时:http://www.mafengwo.cn/poi/18972.html,抓取不到网站源代码,网页查看时有,但是python get不到,soup、xpath都查不到,请问是什么问题,怎么爬取呢?
图片说明

我这里看了下,用到了gzip压缩,你有正确解压缩么,文本的编码是否正确。

你可以看看是否为动态加载页面,如果是,你可以使用selenium库的webdriver来动态爬取
首先在你的浏览器上安装对应的插件(例如我的浏览器是chrome)
driver = webdriver.Chrome
driver.get('website')
如果要想保存登录信息,可以去我的博文里看看

近期文章

  • 用python 中socket模块中的raw制造icmp包问题
  • 如何判断22点-24点之间加5分钟,凌晨1点到2点加5分钟,其余时间是加10分钟?要显示2019-11-21 22:00:00
  • c++二叉树应用实例判断两个二叉树是否相似
  • 如何使用PHP解析HTML表? [重复]
  • Yii assertTextPresent无效
  • php查询有2个计数和连接
  • 如果(作者)声明在Joomla 1.5中
  • 结束会话/清除cookie
  • 如何监控XCache性能
  • mod_rewrite重定向到错误的目录
  • 如何确定新商品的订单?
  • 如何使用alert发送jquery $ .post
  • 任何加快价格指数的方法
  • 在cakephp中更改表头
  • PHP从类返回mysql数组
  • 在zen购物车中显示下拉菜单
  • PHP,OOP接口和抽象[重复]
  • 从php中的HTTP POST获取内容
  • 从服务器设置HTTP Referrer?
  • mysql_real_escape_string和json

Copyright ©2022 我爱占星 All Rights Reserved.

浙ICP备2022030071号-1

部分图文来自网络,如有侵犯您的版权,请告诉我们删除

友情链接:代码精华