python工作报告数据提取

任务描述
附件中为工作报告，本题要求将报告中所有包含数字字符的短句（*）进行提取，并根据输入的关键字信息，将报告中关联数据筛选后输出(限于篇幅，本题仅列出部分关联词）。

附件在哪里

不知道你这个问题是否已经解决, 如果还没有解决的话:

帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/7696313
你也可以参考下这篇文章：Python生成两个随机数，并将生成的数随机组成10道加减乘除基本运算，输入结果判断对错并打分。
你还可以看下python参考手册中的 python- 定义扩展类型：已分类主题- 终结和内存释放

除此之外, 这篇博客: Python制作某电商平台商品竞拍脚本，能自动定时、抢拍、购买中的 时间对比，时间到的话就点击结算 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:

if now > times:
    while True:
        try:
            if browser.find_element_by_id("J_SelectAll2"):
                browser.find_element_by_id("J_SelectAll2").click()
                break
        except:
            print("找不到购买按钮")
    # 点击结算按钮
    while True:
        try:
            if browser.find_element_by_link_text("结 算"):
                browser.find_element_by_link_text("结 算").click()
                print("结算成功")
                break
        except:
            pass

您还可以看一下 jeevan老师的Python量化交易，大操手量化投资系列课程之内功修炼篇课程中的讲师简介，量化交易介绍及自动化交易演示小节, 巩固相关知识点

以下回答来自chatgpt:

我的解决方案如下：

1.读取工作报告的文本内容，并将其保存在一个字符串变量中。

with open('工作报告.txt', 'r', encoding='utf-8') as f:
    content = f.read()

2.使用Python的正则表达式来匹配文本中的数字字符短语。我们可以使用re.findall()方法来查找内容中的所有数字字符短语。

import re
pattern = '\d+[\.]?\d*'
matches = re.findall(pattern, content)

筛选文本中与给定关键字匹配的数字短语。我们可以将需要匹配的关键字放在一个列表中，然后将其与找到的数字短语进行比较，将匹配的结果保存在一个新的列表中。

keywords = ['关键字1', '关键字2', '关键字3']
matched_phrases = []
for match in matches:
    for keyword in keywords:
        if keyword in match:
            matched_phrases.append(match)
            break

输出匹配的数字短语。我们可以使用print()函数来输出得到的结果。

print(matched_phrases)

完整代码如下：

import re

with open('工作报告.txt', 'r', encoding='utf-8') as f:
    content = f.read()

pattern = '\d+[\.]?\d*'
matches = re.findall(pattern, content)

keywords = ['关键字1', '关键字2', '关键字3']
matched_phrases = []
for match in matches:
    for keyword in keywords:
        if keyword in match:
            matched_phrases.append(match)
            break

print(matched_phrases)

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^