python爬虫基础问题

问题有点多,感谢你的耐心解答!

import urllib.request
from urllib.error import URLError,HTTPError,ContentTooShortError

def download(url,cishu=2):
print ('Downloading:',url)
try:
html=urllib.request.urlopen (url).read()
except (URLError,HTTPError,ContentTooShortError)as e:
print ('Download error:',e.reason) # e.reason是什么?
html=None # 为什么要设置为None?
if cishu>0:
if hasattr(e,"code") and 500 <= e.code < 600: #"code"是什么 ?
return download(url,cishu-1) #它返回的是一个函数的调用,是覆盖了原本的download(url,cishu=2),还是对download(url,cishu=2)复制,创建一个新函数?
return html

  1. e.reason 是前面捕获的错误对象(URLError,HTTPError,ContentTooShortError)的reason属性,该属性用于返回错误的原因;
  2. 为什么要设置为None 这里是根据自己的业务要求手动制成的,应该是后面要据此进行相关判断,这个需要看自己的使用要求
  3. "code"是什么 ? 这个跟第一个问题有点像,你知道了e是啥,就知道code是啥了;e是捕获的异常对象,code是该对象的一个属性
  4. download(url,cishu-1) 它返回的是一个函数的调用,不是对原有函数的覆盖;打个比方,刀是download函数,你用刀切菜是一种调用,你用刀切水果也是一种调用,刀还是原来的刀。