写了一个新闻页面的爬虫程序
前几天还运行的好好的
今天突然用不了了
期间没改过代码
运行的时候也没报错
就是前端页面里面显示无数据
有没有佬知道是怎么回事啊
或者可以帮忙修改一下吗
可有偿😭
这个很正常,你这里是没改,但是人新闻网站可能改了。
这说明人家不想让你爬数据,如果你有办法继续爬到数据,人家就会考虑报警。
这个问题,一般是由于网页结果变动,或者被防爬导致的,你可以尝试将url复制到浏览器中看是否能打开,如果不能,说明被防爬了,如果可以说明有可能网页结构变化了
# -*- coding: utf-8 -*-
import numpy as np
import statsmodels.api as sm
import pandas as pd
import matplotlib.pyplot as plt
data=pd.read_excel('dy01.xlsx',encoding='ute-8')
y=data['box-office']
x1=data['release-time']
x2=data['score']
x3=data['score-num']
x4=data['length']
x5=data['name']
x6=data['h1']
x7=data['h2']
x8=data['h3']
x=np.column_stack((x2,x3,x4,x6,x7,x8))
# 线性回归拟合
x_n = sm.add_constant(x) #statsmodels进行回归时,一定要添加此常数项
model = sm.OLS(y, x_n) #model是回归分析模型
results = model.fit() #results是回归分析后的结果
#输出回归分析的结果
print(results.summary())
print('Parameters: ', results.params)
print('R2: ', results.rsquared)
#以下用于出图
plt.figure()
plt.rcParams['font.sans-serif'] = ['Kaiti'] # 指定默认字体
plt.title(u"线性回归预测")
plt.xlabel(u"x")
plt.ylabel(u"price")
plt.axis([0, 3000000, 0, 5000000000])
plt.scatter(x, y, marker="o",color="b", s=50)
plt.plot(x_n, y, linewidth=3, color="r")
plt.show()
很抱歉,以上参考资料与问题无关,无法为您提供解决方案。请提供更详细的问题描述,以便更好地帮助您解决问题。