求助大神们。如何提取出文本中的学科,特征是“【学科分类】”,并将参考文献中的图书引文按学科分类提取出来,图书引文的特征是以“xxx出版社”或是“xxxPress”结尾。文本数量很多。
re库 用正则表达式不可以么
文本处理提取,可以考虑用正则表达式