python工作报告数据提取

任务描述
附件中为工作报告,本题要求将报告中所有包含数字字符的短句(*)进行提取,并根据输入的关键字信息,将报告中关联数据筛选后输出(限于篇幅,本题仅列出部分关联词)。

img

img

附件在哪里

不知道你这个问题是否已经解决, 如果还没有解决的话:
  • 帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/7696313
  • 你也可以参考下这篇文章:Python生成两个随机数,并将生成的数随机组成10道加减乘除基本运算,输入结果判断对错并打分。
  • 你还可以看下python参考手册中的 python- 定义扩展类型:已分类主题- 终结和内存释放
  • 除此之外, 这篇博客: Python制作某电商平台商品竞拍脚本,能自动定时、抢拍、购买中的 时间对比,时间到的话就点击结算 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:
    if now > times:
        while True:
            try:
                if browser.find_element_by_id("J_SelectAll2"):
                    browser.find_element_by_id("J_SelectAll2").click()
                    break
            except:
                print("找不到购买按钮")
        # 点击结算按钮
        while True:
            try:
                if browser.find_element_by_link_text("结 算"):
                    browser.find_element_by_link_text("结 算").click()
                    print("结算成功")
                    break
            except:
                pass
    
  • 您还可以看一下 jeevan老师的Python量化交易,大操手量化投资系列课程之内功修炼篇课程中的 讲师简介,量化交易介绍及自动化交易演示小节, 巩固相关知识点
  • 以下回答来自chatgpt:

    我的解决方案如下:

    1.读取工作报告的文本内容,并将其保存在一个字符串变量中。

    with open('工作报告.txt', 'r', encoding='utf-8') as f:
        content = f.read()
    

    2.使用Python的正则表达式来匹配文本中的数字字符短语。我们可以使用re.findall()方法来查找内容中的所有数字字符短语。

    import re
    pattern = '\d+[\.]?\d*'
    matches = re.findall(pattern, content)
    
    1. 筛选文本中与给定关键字匹配的数字短语。我们可以将需要匹配的关键字放在一个列表中,然后将其与找到的数字短语进行比较,将匹配的结果保存在一个新的列表中。
    keywords = ['关键字1', '关键字2', '关键字3']
    matched_phrases = []
    for match in matches:
        for keyword in keywords:
            if keyword in match:
                matched_phrases.append(match)
                break
    
    1. 输出匹配的数字短语。我们可以使用print()函数来输出得到的结果。
    print(matched_phrases)
    

    完整代码如下:

    import re
    
    with open('工作报告.txt', 'r', encoding='utf-8') as f:
        content = f.read()
    
    pattern = '\d+[\.]?\d*'
    matches = re.findall(pattern, content)
    
    keywords = ['关键字1', '关键字2', '关键字3']
    matched_phrases = []
    for match in matches:
        for keyword in keywords:
            if keyword in match:
                matched_phrases.append(match)
                break
    
    print(matched_phrases)
    

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^