请问python爬虫

提取某学校网站首页中通知通告内容的标题和日期,并保存成文件。
写出来的代码运行后一片空白,救!

你得贴代码和具体的错误之类的

  • 你可以看下这个问题的回答https://ask.csdn.net/questions/7431297
  • 这篇博客也不错, 你可以看下Python 实训1 计算出斐波那契数列前两项给定长度的数列,并删除重复项和追加数列各项之和为新项
  • 同时,你还可以查看手册:python- 定义扩展类型:已分类主题- 对象展示 中的内容
  • 除此之外, 这篇博客: 【微信读书每日一答辅助小程序】使用python对每日一答问题进行识别,并将结果保存到剪贴板以便搜索。中的 4 文字识别 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
  •   在此需要用到百度AI开放平台文字识别技术,因此需要注册百度智能云账号/百度账号,注册过程十分简单,一分钟完成,具体步骤可以参考。
      为了使用该功能,需要安装baidu-aip第三方库,很小巧且好用的一个库,识别速度很快,2秒左右。具体代码如下:

    from aip import AipOcr
    
    def word_identify():
        #输入自己的应用的信息
        APP_ID = '***'
        API_KEY = '***'
        SECRET_KEY = '***'
        client= AipOcr(APP_ID, API_KEY, SECRET_KEY)
        #读取图片信息,返回二进制结果
        img = get_file_content()
        #返回识别结果
        res = client.basicGeneral(img)
        print(res)
        #返回识别结果中的文字信息
        return ''.join([word['words'] for word in res['words_result']])
    
  • 您还可以看一下 王进老师的跟着王进老师学开发Python篇:基础入门案例讲解课程中的 案例02:计算生日是一年中多少天小节, 巩固相关知识点
  • 以下回答由chatgpt基于相关博客总结生成:

    为了更好地帮助您解决问题,以下是更具体的步骤:

    1. 利用Python的requests库向学校网站首页发送Get请求,并获取网页源代码。
    import requests
    
    url = '学校网站首页的URL'
    response = requests.get(url)
    content = response.text
    
    1. 利用正则表达式从网页源代码中提取通知通告的标题和日期,并将其保存至文件中。
    import re
    
    # 利用正则表达式从网页源代码中提取通知通告的标题和日期
    pattern = re.compile(r'<a.*?href=".*?">(.*?)</a>.*?<span class="date">(.*?)</span>', re.S)
    results = re.findall(pattern, content)
    
    # 将提取的标题和日期保存至文件中
    with open('result.txt', 'w', encoding='utf-8') as f:
        for result in results:
            f.write(result[0] + '\t' + result[1] + '\n')
    
    1. 如果您的代码运行后出现了一片空白,请先检查是否正确导入了requests库和re库、是否正确设置了学校网站首页的URL、是否存在通知通告的标题和日期等问题。

    希望这些具体的步骤能够帮助您解决问题。