python 数据清洗的问题 正则表达式

数据是这种样式的 厂号 + (处理方式):
4(屠宰、分割、冷藏)、7(屠宰、分割、冷藏)、67(屠宰、分割、冷藏)、154(屠宰、分割、冷藏)、194(屠宰、分割、冷藏)、195(屠宰、分割、冷藏)、203(屠宰、分割、冷藏)、89、100
需要提取每个厂号和对应括号里面的内容 想了半天没想出来。

不知道我理解的意思和你描述的意思是否,我理解的意思如下,不需要用到正则表达式:

Plant_no = (4, 7, 67, 154, 194, 195 , 203, 89, 100)
handling = ('屠宰','分割','冷藏')
for i in Plant_no:
    for j in handling:
        print('厂号:%d,处理方式:%s'%(i, j))

如有帮助,请点击“采纳”,谢谢

下面的正则匹配,如果厂号后面没有内容的则匹配不出来


#!/usr/bin/env python
#-*- coding:utf-8 -*-

import re
data = """
4(屠宰、分割、冷藏)、7(屠宰、分割、冷藏)、67(屠宰、分割、冷藏)、154(屠宰、分割、冷藏)、194(屠宰、分割、冷藏)、195(屠宰、分割、冷藏)、203(屠宰、分割、冷藏)、89、100
"""

regx = re.compile(r'(\d+?)[\(\(]([\w\W\s\S].*?)[\)\)]')

for item in re.findall(regx,data):
    # print("code={}, content={} ".format(item[0] ,item[1] ))
    print("code={}, content={} ".format(item[0] , '-'.join(item[1].split('、'))  ))

不清楚你的需求,建议直接贴范例