.已知数据集nycfilghts13。
(1)计算出每个目的地的平均延误时间,然后与airports数据框连接,从
而展示出延误的空间分布。以下是画出美国地图的一种简单方法。你可以使用
数据点的size或color属性来表示每个机场的平均延误时间。
airports%>%semi_join(flights,c("faa"="dest"))%>%ggplot(aes(lon,lat))+borders("state")+geom_point()+coord_quickmap()
(2)2013年6月13日发生了什么情况?展示出这天延误时间的空间模式,并上网查询一下这天的天气状况。
(3)找出这一整年中航班延误(dep_delay+arr_delay)最严重的48小
时。与weather数据互相参照,你能找出一些特征吗?
(1) 计算每个目的地的平均延误时间,并与airports数据框连接,展示延误的空间分布:
library(dplyr)
library(ggplot2)
# 计算每个目的地的平均延误时间
delay_by_dest <- flights %>%
group_by(dest) %>%
summarize(avg_delay = mean(arr_delay, na.rm = TRUE))
# 与airports数据框连接
delay_by_dest <- airports %>%
left_join(delay_by_dest, by = c("faa" = "dest"))
# 画出美国地图
ggplot(delay_by_dest, aes(lon, lat)) +
borders("state") +
geom_point(aes(size = avg_delay), alpha = 0.8) +
scale_size_continuous(range = c(1, 10)) +
coord_quickmap()
(2) 找出2013年6月13日的延误时间空间模式,并查询该天的天气状况:
# 找出2013年6月13日的延误时间空间模式
delay_by_dest <- flights %>%
filter(year == 2013, month == 6, day == 13) %>%
group_by(dest) %>%
summarize(avg_delay = mean(arr_delay, na.rm = TRUE))
delay_by_dest <- airports %>%
left_join(delay_by_dest, by = c("faa" = "dest"))
ggplot(delay_by_dest, aes(lon, lat)) +
borders("state") +
geom_point(aes(size = avg_delay), alpha = 0.8) +
scale_size_continuous(range = c(1, 10)) +
coord_quickmap()
(3) 找出这一整年中航班延误最严重的48小时,并与weather数据互相参照,找出一些特征:
# 找出这一整年中航班延误最严重的48小时
flights %>%
mutate(delay = dep_delay + arr_delay) %>%
arrange(desc(delay)) %>%
select(year, month, day, hour, delay) %>%
head(48)
您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!