使用data(iris)命令,调用数据分析不同种类的鸢尾花

使用data(iris)命令,调用数据分析不同种类的鸢尾花。

1.iris数据中virginica(弗吉尼亚鸢尾)的样本大小是多少?

2.假设鸢尾花的面积以长方形计,问三种鸢尾花的花瓣面积之间是否差异显著,哪种花的花瓣面积最大。用箱型图展示三种鸢尾花面积的差别,要求以不同颜色表示不同花的种类。将结果输出为宽:高=4:3的jpg格式图片。

3.三种鸢尾花的花萼长度与花瓣长度之间相关度如何,是否都显著相关?哪种花计算出来的相关性更强?

4.比较setosa和versicolor两种鸢尾花的花萼长度(Sepal.Length)之间是否差异显著,哪种花的花萼长度最大。

1,在iris数据中,使用命令 summary(iris$Species=="virginica") 可以得到virginica的样本大小为50。
2,可以使用命令 boxplot(iris$Petal.Area~iris$Species, col=c("red","green","blue")) 展示三种鸢尾花面积的差别,并使用不同颜色表示不同花的种类。使用命令 par(mfrow=c(4,3)) 将结果输出为宽:高=4:3的jpg格式图片。
3,可以使用命令 cor(iris$Sepal.Length, iris$Petal.Length) 来计算三种鸢尾花的花萼长度与花瓣长度之间的相关度。如果返回的相关性值绝对值大于0.7,可以认为相关度显著。可以使用命令 t.test(iris$Sepal.Length[iris$Species=="setosa"], iris$Sepal.Length[iris$Species=="versicolor"]) 比较setosa和versicolor两种鸢尾花的花萼长度(Sepal.Length)之间的差异显著性,如果p-value小于0.05,可以认为差异显著。
4,通过进行t检验或单因素方差分析,可以检验setosa和versicolor两种鸢尾花的花萼长度之间是否存在显著差异。如果p值小于0.05,则说明两种鸢尾花的花萼长度存在显著差异。
通过查看数据可以发现,setosa鸢尾花的花萼长度平均值为5.01,versicolor鸢尾花的花萼长度平均值为5.94,versicolor鸢尾花的花萼长度显然比setosa鸢尾花的花萼长度要大。

可参考