想做一个python小程序 (初学者英文书辅助阅读器)

怎么做一个程序:能把书(txt\pdf\word)里的每个单词都趴一遍,
并按出现的顺序 组成没有重复的列表,
并从词典网站拉取音标注音和简单词义(简单词义提供自定义修改的方法);
然后提供一个输入接口,
能逐个输入或用TXT 导入已经认识的词汇。
然后可以屏蔽这些传入词汇。。。

以前学英语我用C#做过,但是发现和想象中的不同,所谓的"简单词义"对于理解文章意义不大。"屏蔽的词汇"往往其实造成你misunderstanding
英语中往往很多简单的词汇有很多不同的意思:
well可以是水井
till可以是耕种
keen可以是价格便宜
very own你知道什么意思么?
console除了控制台,还可以是安慰
project除了项目,还可以是投射
也许你知道as soon as是尽可能快,但是as long as不是尽可能长,as well as也不是尽可能好
engage有差不多10个不同的意思
mean可以表示刻薄,还可以表示平均数
leaves既可以是离开,也可以是叶子的复数
python到底是蟒蛇还是编程语言
...
如果你觉得把词汇意思搞清楚就能看懂文章,你还不如机器翻译下,不但有词汇的意思,而且计算机已经根据概率挑选了最有可能的意思,但是你还是看不懂。

从意义的角度看,英文单词是一种介于我们的汉字和词之间的东西——我们的汉字更没有意义,我们的词更有意义。而实际上,英文的sense group大致才相当于我们的词。