python正则问题

最近想实现一个功能,能提取Word文档中的题目,按照选择题填空题分开来存放,但是在提取题目就卡住了,像这种有换行,注意事项这种迷惑项我无法将其区分,请各位亲们帮帮忙

img

  1. 注意事项中三条是不需要的
  2. 选择题第一题中间有换行(读取Word文档时第一大题这个描述会和选择题贴在一起,这也不知道怎么解决)

最简单的思路就是用字符串的各种判断函数做识别。首先以行的形式读取文件,然后通过判断语句是否含有“单项”进行进一步操作