关于word文档格式代码问题

数据清洗是数据统计分析之前非常重要的一步,请按要求编程完成以下数据的清洗。
《论语》是儒家学派的经典著作之一,主要记录了孔子及弟子的言行。从网上下载了一个版本,名为“论语-网络版.txt”,内容采用如下格式组织:
【原文】
1-1子曰(1):“学(2)而时习(3)之,不亦说(4)乎?有朋(5)自远方来,不亦乐(6)乎?人不知(7),而不愠(8),不亦君子(9)乎?”
「注释」
(略)
「译文」
(略)
「评析」
(略)
该版本通过【原文】标记《论语原文内容》,采用「注释」、「译文」、「评析」
标记对原文的注释、译文和评析。
问题1:请编写程序,提取《论语》文档中所有的原文内容,输出保存到“论语-提取版.txt”文件。输出文件格式要求:去掉文章中原文部分每行行首空格及如“1-1”等的数字标志,行尾为空格、无空行。参考格式如下:
子曰(1):“学(2)而时习(3)之,不亦说(4)乎?有朋(5)自远方来,不亦乐(6)乎?人不知(7),而不愠(8),不亦君子(9)乎?”
问题2:请编写程序,在“论语-提取版.txt”基础上,进一步去掉每行文字中所有括号及内部数字,保存为“论语-原文.txt”文件。参考格式如下:
子曰:“学而时习之,不亦说乎?有朋自远方来,不亦乐乎?人不知,而不愠,不亦君子乎?”
问题3、统计一下“曰“在文中出现的次数