a = '1 清华大学 969.2 2 北京大学 855.3' import re re.sub("[A-Za-z0-9\!\%\[\]\,\。\ \.]", "", a)
import re s = '1 清华大学 969.2 2 北京大学 855.3' x =re.findall("([\u4e00-\u9fa5]+)", s) print(x) '''--result ['清华大学', '北京大学'] '''