R语言中的数据处理问题

.已知数据集nycfilghts13。
(1)计算出每个目的地的平均延误时间,然后与airports数据框连接,从
而展示出延误的空间分布。以下是画出美国地图的一种简单方法。你可以使用
数据点的size或color属性来表示每个机场的平均延误时间。
airports%>%semi_join(flights,c("faa"="dest"))%>%ggplot(aes(lon,lat))+borders("state")+geom_point()+coord_quickmap()
(2)2013年6月13日发生了什么情况?展示出这天延误时间的空间模式,并上网查询一下这天的天气状况。
(3)找出这一整年中航班延误(dep_delay+arr_delay)最严重的48小
时。与weather数据互相参照,你能找出一些特征吗?

(1) 计算每个目的地的平均延误时间,并与airports数据框连接,展示延误的空间分布:

library(dplyr)
library(ggplot2)

# 计算每个目的地的平均延误时间
delay_by_dest <- flights %>%
  group_by(dest) %>%
  summarize(avg_delay = mean(arr_delay, na.rm = TRUE))

# 与airports数据框连接
delay_by_dest <- airports %>%
  left_join(delay_by_dest, by = c("faa" = "dest"))

# 画出美国地图
ggplot(delay_by_dest, aes(lon, lat)) +
  borders("state") +
  geom_point(aes(size = avg_delay), alpha = 0.8) +
  scale_size_continuous(range = c(1, 10)) +
  coord_quickmap()

(2) 找出2013年6月13日的延误时间空间模式,并查询该天的天气状况:

# 找出2013613日的延误时间空间模式
delay_by_dest <- flights %>%
  filter(year == 2013, month == 6, day == 13) %>%
  group_by(dest) %>%
  summarize(avg_delay = mean(arr_delay, na.rm = TRUE))

delay_by_dest <- airports %>%
  left_join(delay_by_dest, by = c("faa" = "dest"))

ggplot(delay_by_dest, aes(lon, lat)) +
  borders("state") +
  geom_point(aes(size = avg_delay), alpha = 0.8) +
  scale_size_continuous(range = c(1, 10)) +
  coord_quickmap()

(3) 找出这一整年中航班延误最严重的48小时,并与weather数据互相参照,找出一些特征:

# 找出这一整年中航班延误最严重的48小时
flights %>%
  mutate(delay = dep_delay + arr_delay) %>%
  arrange(desc(delay)) %>%
  select(year, month, day, hour, delay) %>%
  head(48)
您好,我是有问必答小助手,您的问题已经有小伙伴帮您解答,感谢您对有问必答的支持与关注!
PS:问答VIP年卡 【限时加赠:IT技术图书免费领】,了解详情>>> https://vip.csdn.net/askvip?utm_source=1146287632