语料库中完成词类和短语的条件概率

用python语言,在语料库中完成以下几个问题:

  1. 任选一个构式,比如“X不到哪里(去)”,计算其中的变项X的特性:
    (1) X的条件概率
    (2) X的词类分布

  2. 任选两个同义词或近义词,比较其搭配词的不同,在两个层面上进行比较:
    (1)与其搭配的具体词的差异:
    a.窗口大小:左边三个词范围内的所有词和右边三个词范围内所有的词,分别列出;
    b.比较内容:条件概率和互信息。

(2)与其搭配的词类的差异
a.窗口大小:左边三个词范围内的所有词的词类和右边三个词范围内所有的词的词类,分别列出;
b.比较内容:条件概率和互信息。

语料库中完成词类和短语的条件概率
https://blog.csdn.net/weixin_35193765/article/details/114914502