招标文件里的供应商的资料爬下来后,老板只要所有供应商的名称,这些供应商包括了企业,医院,学校,合作社等等,怎么样快速把这些信息提取出来,最终要的格式是——供应商名称:XXXX公司(医院,学校这样)用regex可以实现的话麻烦各位大神帮忙写个regex,用机器学习的话麻烦大神们给个思路,谢谢!
一定格式的,可以用正则表达式。但是没有格式的,这个只能用语义分析,并且不能做到100%准确。