wget + nginx 制作网站镜像的坑
再往上查阅了好多资料,查阅了很多可以使用wget对网站进行镜像的方法,本人才尝试后遇到下面一个问题
使用wget http://www.example.com/ -mkL 对网站进行递归下载
随后本地生成了一堆文件夹和文件
当我本地尝试反问镜像网站的的时候 ,发现请求链中有一些请求出现404的状态码
经过排查后发现文件夹中保存文件是这样的
由于我再镜像的时候进行递归下载保存,有些请求在保存时将请求参数一同保存变成文件名
比如请求是http://host/style.css?v=1.2.1 ,在保存的时候生成的文件名叫 style.css?v=1.2.1这就
导致之后在访问的时候其实是要找到style.css的这个文件,跟保存的文件不匹配,这可咋整?
网上查询虽然可以使用wget -O 进行自定义名字,但是这些操作都过于基础 ,如何镜像时候同步自定义名字,或者同步自定义名字时能够对原来的名字进行截取? 再或者可以有直接屏蔽参数保存文件名的方法,有没有办法解决
截取问号之前的名字。然后遍历重命名
wget 就是linux的命令,下载文件; 你 wget http://www.example.com/ 相当于下载网站(静态文件,js,图片。。。)