如何将作者这一列中的国家和作者姓名分别提取成新的一列？

我在提取数据的时候，不知道如何将作者这一列中的国家和作者姓名分别提取出来

import re
import pandas as pd
df = pd.DataFrame(columns = 'info,vote_count'.split(','))
df.loc[len(df)] = ['[中] 余华/江南出版社/1990-27/20元','fasdf12345']
df.loc[len(df)] = ['[澳大利亚] 余华/江南出版社/1990-27/20元','fasdf12345']
df.loc[len(df)] = ['余华/江南出版社/1990-27/20元','fasdf12345']
print(df)
df[['作者','出版社','出版时间','售价']] =[x.split('/') for x in df['info'].tolist()]
df['vote_count'] =  [re.search('\d+',x).group() for x in df['vote_count'].tolist()]
df1  = df[['作者','出版社','出版时间','售价','vote_count']]
print('------------------------')
# print(df1)
####这是咱们上次处理的结果,这次增加一个国籍列
#### 由于存在部分作者前面没有国籍,所以需要判断是否存在。
df1['国籍'] = [re.search(r'\[([\u4e00-\u9fa5]*)\]',x).group(1) if re.search(r'\[([\u4e00-\u9fa5]+)\]',x) else '' for x in df['作者'].tolist()]
df1['作者_1'] = [re.search(r'\]\s([\u4e00-\u9fa5]*)',x).group(1) if re.search(r'\[([\u4e00-\u9fa5]*)\]',x) else x for x in df['作者'].tolist()]
df1 = df1[['出版社','出版时间','售价','vote_count','国籍','作者_1']]
print(df1)

效果


import re
a = ['[清] 曹雪芹 著 / 人民文学出版社 / 1996-12 / 59.70元'
     ,'余华 / 作家出版社 / 2012-8-1 / 20.00元'
     ,'[英] 乔治·奥威尔 / 刘绍铭 / 北京十月文艺出版社 / 2010-4-1 / 28.00'
     ,'[哥伦比亚] 加西亚·马尔克斯 / 范晔 / 南海出版公司 / 2011-6 / 39.50元'
     ,'刘慈欣 / 重庆出版社 / 2012-1-1 / 168.00元']

for info in a:
    v = info.split('/')
    翻译 = ''
    if len(v) == 5:
        翻译 = v[1].strip()
    国家,作者 = re.findall(r'^\s*(?:\[(.+)\])?\s*([^\s]+)',v[0].strip())[0]
    出版社 = v[-3].strip()
    时间 = v[-2].strip()
    价格 = v[-1].strip()
    print(国家,作者,翻译,出版社,时间,价格)

找到这个表单接口,直接拿到接口数据进行提取比较方便

你可以参考下这个问题的回答, 看看是否对你有帮助, 链接: https://ask.csdn.net/questions/7474908
这篇博客你也可以参考下：爬取中国移动用户问答
除此之外, 这篇博客: 数据可视化分析工具如何在国内弯道超车，迅速崛起？中的 国内外数据可视化工具汇总 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
“我想转行做数据分析，但是我只会用Excel，不会其他的工具，有其他的数据分析工具推荐么？“
“我不会python，那我可以做数据分析吗”
大部分人对数据分析的的第一印象就是Excel、python，其实选择一个工具开始学习是需要花费学习成本的，如果不清楚这款工具能给你带来什么价值，就开始盲目学习，很可能会浪费时间。那么今天我们就从整个数据分析流程，从数据接入到大屏、数据处理、报表制作来聊一聊国外内主流的数据分析可视化工具
您还可以看一下赖国荣老师的微信生活缴费商业项目标准版课程中的第2讲：【赖国荣】搭建项目，实现配置文件，数据库连接小节, 巩固相关知识点