引号里嵌入引号
1.要用不同的引号,比如 'sss"aa' 这样是可以的
2.可以用转义符比如"\"" ,单引号亦可 "\'"
你上面的语句,实际上是指字符串的连接,同一行上如果前后都是字符串,中间不用加号也可以连接字符串,如
a = 'aaaaa' "bbbbb" 则a中的值是aaaaabbbbb 如果在字符串前加一个字母r则表示原字符,即不将\转义
我在前面说的,因为有的时候网址欺骗我们,不给我们显示实际的页码,我们就直接暴力爬取目前可观的最多的页码30页,前开后闭,还多执行一点。
urla=[]
for dq in dqs:
for i in range(0,31):
urla.append('https://www.liepin.com/zhaopin/?compkind=&dqs='+dq+'&pubTime=&pageSize=40&salary=&compTag=&sortFlag=15°radeFlag=0&compIds=&subIndustry=&jobKind=&industries=&compscale=&key='+word+'&siTag=LGV-fc5u_67LtFjetF6ACg%7E_FrslumzzaHrHe3aSW0VTQ&d_sfrom=search_prime&d_ckId=489b14685f420f9c47017c369cb1c6f9&d_curPage=0&d_pageSize=40&d_headId=489b14685f420f9c47017c369cb1c6f9&curPage='+str(i))
先用url=[]
构建空列表,用第一层循环来把地区的列表遍历读入,第二次循环来拿页码。每循环一次第二层循环urla累加一次新的外部网址,这里可以想象自己去商店拿篮子买东西。
执行完可以用print(uela)
打印收集到的外部网址,用len(urla)
查看外部网址数据量。