python 数据清洗的问题正则表达式

数据是这种样式的厂号 + (处理方式)：
4(屠宰、分割、冷藏)、7（屠宰、分割、冷藏）、67（屠宰、分割、冷藏）、154（屠宰、分割、冷藏）、194（屠宰、分割、冷藏）、195（屠宰、分割、冷藏）、203（屠宰、分割、冷藏）、89、100
需要提取每个厂号和对应括号里面的内容想了半天没想出来。

不知道我理解的意思和你描述的意思是否，我理解的意思如下，不需要用到正则表达式：

Plant_no = (4, 7, 67, 154, 194, 195 , 203, 89, 100)
handling = ('屠宰','分割','冷藏')
for i in Plant_no:
    for j in handling:
        print('厂号：%d，处理方式：%s'%(i, j))

如有帮助，请点击“采纳”，谢谢

下面的正则匹配，如果厂号后面没有内容的则匹配不出来


#!/usr/bin/env python
#-*- coding:utf-8 -*-

import re
data = """
4(屠宰、分割、冷藏)、7（屠宰、分割、冷藏）、67（屠宰、分割、冷藏）、154（屠宰、分割、冷藏）、194（屠宰、分割、冷藏）、195（屠宰、分割、冷藏）、203（屠宰、分割、冷藏）、89、100
"""

regx = re.compile(r'(\d+?)[\(\（]([\w\W\s\S].*?)[\)\）]')

for item in re.findall(regx,data):
    # print("code={}, content={} ".format(item[0] ,item[1] ))
    print("code={}, content={} ".format(item[0] , '-'.join(item[1].split('、'))  ))

不清楚你的需求，建议直接贴范例

python 数据清洗的问题 正则表达式

python 数据清洗的问题正则表达式