set() 函数创建一个无序不重复元素集,可进行关系测试,删除重复数据,还可以计算交集、差集、并集等。
set(STOPWORDS) 对原有的数据集进行去重stopwords.add("said") 向集合中添加一个元素said
set是集合,可以去掉STOPWORDS中的重复元素,stopwords.add就是往集合stopwords里面添加元素'said'