我爱占星网 我爱占星网
首页
编程
java
php
前端
首页 编程 java php 前端

python 正则去除script标签及内容

re_script=re.compile('<\s*script[^>]*>[^<]*<\s*/\s*script\s*',re.I)#Script
the_page=re_script.sub('',the_page) #去掉SCRIPT

正则去除html的script标签,包括

、 、

总是去的不完全,求问正则要怎么改一下?

比如这个网址:http://m.yanqingkong.com/

<(\s*script).*>.*</\1>
写了一个,具体还是发你的数据上来吧

近期文章

  • 为什么Android studio 会给Chronometer自动加上final类型呢??
  • 在SQLyog中,测试一条SQL语句的状态是什么?
  • android使用volley网络请求一段时间后,时不时返回429错误,何解?
  • 参数传递找不到,报500
  • To Be NUMBER ONE
  • 请问这个是什么原因啊,访问冲突问题.
  • 注册时向自己的邮箱发送验证码,老是报错,求解决!!!!
  • 浏览器jquery加载不了
  • cannot read property style of null
  • java中如何获得每个线程单独运行的时间呢?
  • 求助 gitlab 的问题!
  • 查询数据类型为blob类型 报错
  • 关于duilib中htm字体的问题
  • 侯捷的《stl源码剖析》中的红黑树算法描述有问题?
  • ThreadLocal 缓存可重用的StringBuilder能够在多线程环境下使用吗?
  • Hadoop NameNode 死亡原因?
  • CBC加密中IV为什么要随机选取,IV直接加1会出现什么安全问题
  • C当中TIME LIMIT EXCEED的问题
  • Splendid Moment Collector
  • android手机和单片机之间的数据通信

Copyright ©2022 我爱占星 All Rights Reserved.

浙ICP备2022030071号-1

部分图文来自网络,如有侵犯您的版权,请告诉我们删除

友情链接:代码精华