Excel通过Python来处理(求代码!!!)

想要统计大概200个国家的大概80个属性数据,但是由于信息源给的数据中各国命名不同,有些国家没有数据还被删掉了,然后就导致导入进同一个excel表的时候一个国家的多个属性数据就不在同一行。但是因为又需要把每个国家的各个属性数据列为一行,所以现在想用Python实现,无奈本人程序小白不会编写,希望能有能者帮个忙,看看能不能写个代码(最好带解释的)来实现这个功能。

数据发我看看,给我讲一下列名

如果数据格式非常乱, 那么你要先整理格式, Python 也帮不了你太多。 (测试编辑自己的回答)

格式整理差不多之后, 可以考虑:

1) 把数据另存为 .csv 格式

2)用 Python 来读 .csv 文件,再按照数据类型来处理。 

是这样的,文件格式全都是csv,没有乱码

主要是就是不会处理,相把每个国家作为一个数组,里面第一个数是属性1的值,第二个数是属性2的值。。。每个国家都这样

实现的代码不会写

乱不怕,只要数据有规律就能处理

程序也不是万能的,程序处理之前 需要先确定好规则。

比如 各国命名不同,那么不同的名字之间对应的规律是什么? 比如中国 对应的是 China 还是 chs 还是CN?

有些国家没有数据还被删掉了  这种情况 需要确定 没有数据的国家怎么处理,怎么知道是被删掉了,或者直接不处理?

贴一部分测试数据上来,可以尝试一下

#!/usr/bin/python3
# -*- coding:utf-8 -*-
__author__ = 'mayi'

import csv

#读取第二列的内容
with open("test.csv", "r", encoding = "utf-8") as f:
    reader = csv.reader(f)
    column = [row[1] for row in reader]

print(column)

 

['Name', 'mayi', 'jack', 'tom', 'rain']

太笼统,提供数据和需要的结果举例

说的太模糊了吧,你这么问谁也帮不了你。别着急慢慢思考下

如果是excel规范化的数据,只是错行之类的错误,处理难度应该还行,但是如果可以给下样例数据,处理才更有针对性。