这里主要是用到了re模块种的sub方法,将非中文部分除去。
import re def extract_pure_chinese(key_str): return re.sub("[^\u4e00-\u9fa5]", "", key_str)