python工作报告数据提取

任务描述
附件中为工作报告,本题要求将报告中所有包含数字字符的短句(*)进行提取,并根据输入的关键字信息,将报告中关联数据筛选后输出(限于篇幅,本题仅列出部分关联词)。

img

img

不知道你这个问题是否已经解决, 如果还没有解决的话:
  • 这个问题的回答你可以参考下: https://ask.csdn.net/questions/7696313
  • 这篇博客你也可以参考下:Python生成两个随机数,并将生成的数随机组成10道加减乘除基本运算,输入结果判断对错并打分。
  • 同时,你还可以查看手册:python- 定义扩展类型:已分类主题- 终结和内存释放 中的内容
  • 除此之外, 这篇博客: Python制作某电商平台商品竞拍脚本,能自动定时、抢拍、购买中的 时间对比,时间到的话就点击结算 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:
    if now > times:
        while True:
            try:
                if browser.find_element_by_id("J_SelectAll2"):
                    browser.find_element_by_id("J_SelectAll2").click()
                    break
            except:
                print("找不到购买按钮")
        # 点击结算按钮
        while True:
            try:
                if browser.find_element_by_link_text("结 算"):
                    browser.find_element_by_link_text("结 算").click()
                    print("结算成功")
                    break
            except:
                pass
    
  • 您还可以看一下 jeevan老师的Python量化交易,大操手量化投资系列课程之内功修炼篇课程中的 讲师简介,量化交易介绍及自动化交易演示小节, 巩固相关知识点
  • 以下回答来自chatgpt:

    我可以给出一个大致的思路,但具体的实现需要结合具体需求和代码中的短句格式进行编写:

    1. 读取工作报告中的每个段落,将每个段落拆分为句子;
    2. 遍历每个句子,判断是否包含数字字符,若包含则提取该句子;
    3. 对提取的句子进行关键字筛选,筛选出包含指定关键字的句子;
    4. 输出符合条件的句子。

    关于具体的代码实现,需要考虑以下问题:

    1. 工作报告的文件格式是什么,如何读取其中的文本内容;
    2. 数字字符的定义是什么,可以采用正则表达式来匹配;
    3. 如何确定关键字和筛选规则;
    4. 输出方式是什么,是显示在终端还是写入文件,输出格式是怎样的。

    在实现过程中可以使用Python的内置模块进行实现,如re模块(使用正则表达式匹配数字字符)、os模块(读取工作报告文件)、argparse模块(解析命令行参数)、sys模块(输出结果)、unittest模块(编写测试用例)。具体实现方式可以根据需要进行调整。


如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^