根据航班信息分析航旅纵横下全国城市人口流动特征,航班信息包括航班号,日期,机型,始发地,目的地,出发,到达,飞行时间等,如何进行分析,如果聚类要怎么做,数据量比较大,有78万条。

根据航班信息分析航旅纵横下全国城市人口流动特征,航班信息包括航班号,日期,机型,始发地,目的地,出发,到达,飞行时间等,如何进行分析,如果聚类要怎么做,数据量比较大,有78万条?

1.本地安装MySQL,Navicat(可以做可视化)

2.编写SQL
当天各城市人口增加减少情况
一周内各城市人口增加减少情况(短期人口流动指标)
一个月内各城市人口增加减少情况
一年内内各城市人口增加减少情况(长期人口流动指标)

可以使用hadoop来进行数据分析处理

select 航班号,日期,机型,始发地,目的地,出发,到达,飞行时间,Count(*) 人次 from 表
group by 航班号,日期,机型,始发地,目的地,出发,到达,飞行时间