你这个又是python,又是C又是C#,到底用什么语言啊。总不能给你写3个吧。
不知道你这个问题是否已经解决, 如果还没有解决的话:data <- read.csv(file, header = TRUE, sep = ',', dec = '.', quote = '"', stringsAsFactors = TRUE, na.strings = 'NA',fileEncoding = "")
其中file为文件路径,header表示是否有表头,默认为TRUE,sep为分隔符,默认为逗号,dec为小数点的表示方式,默认为".",quote为包围数据的符号,默认为"\",stringsAsFactors表示是否把字符型变量转化为因子形式,默认为TRUE,na.strings表示需要替换成NA的字符串,默认为"NA"。fileEncoding表示文件编码方式,默认为空,需要根据实际情况更改,可选值有"UTF-8"、"GBK"等等。
例如:
data <- read.csv("data.csv", fileEncoding="UTF-8")
使用dplyr包,语法如下:
library(dplyr)
data %>% filter(condition) %>% select(column1, column2)
其中,condition表示筛选条件,可以是逻辑表达式。column1, column2表示需要保留的列。
例如,保留性别为女性(sex为"F")的数据,并且只保留姓名和年龄两列:
library(dplyr)
data %>%
filter(sex=="F") %>%
select(name, age)
使用data.table包,语法如下:
library(data.table)
DT <- as.data.table(data)
DT[condition, .(column1, column2)]
其中,condition表示筛选条件,可以是逻辑表达式。.()表示需要选择的列。
例如,保留性别为女性(sex为"F")的数据,并且只保留姓名和年龄两列:
library(data.table)
DT <- as.data.table(data)
DT[sex=="F", .(name, age)]
例如,将数据框data写入Excel文件data.xlsx:
library(xlsx)
write.xlsx(data, file="data.xlsx")