已有1号水文站连续40年的月均流量数据,与它相邻的2号水文站对应的这40年中间有9年的月均流量数据缺失了,用什么方法进行插补比较好?
已做尝试:尝试 用ARIMA建模插补,但是用这种方法是不是只用2号水文站已有数据就能插补?那获取的1号水文站不用来参考不是浪费了。
也尝试 通过求2站每年各月份月均流量的差值平均值,用1号水文站已有的这9年的数据加(减)差值来求2号水文站对应的缺失数据。(由于这个差值也在变化,可以考虑分段计算,具体分成那几段还没有科学的方法)
自己尝试的方法感觉不太好,求更科学的方法。
哈喽,对于水文站流量数据的缺失插补,题主可以考虑以下几种方法:
- 空间插补法:使用相邻水文站的数据进行插补。可以考虑:
(1)求取两站同期数据的回归方程,用来计算缺失期间2号站的数据。这可以充分利用1号站的数据。
(2)分段计算两站流量差值的平均值,加至1号站数据,这种方法考虑了两站关系的变化,较为可靠。
(3)采用普氏互相关法求取两站同期数据的相关系数,判断两站相关程度,再选定合适的插补方法。 - 时间序列插补法:仅使用2号水文站历史数据进行ARMA、ARIMA模型识别和参数估计,对缺失数据进行预测和插补。这种方法简单实用,但无法利用1号站数据。
- 综合插补法:同时使用空间插补法和时间序列插补法。例如:
(1) 求取两站流量的回归方程和ARIMA模型,比较两种方法的精度,选择更优方法进行预测。
(2) 采用árma空间预测模型,同时考虑两站历史数据,通过确定两站流量差值的时空演变规律来进行预测。
(3) 将1号站真实数据与2号站预估数据进行合成,生成2号站较可靠的历史序列,在此基础上识别更准确的时间序列模型进行预测。
综上,我推荐采用综合插补法,同时利用两站历史数据确定空间关系与时间序列规律,选择一种或综合几种方法进行数据插补。这可以综合各种信息以得到最可靠的结果。但无论采用何种方法,都需要分析研究两站流量差值的时空演变规律,这是插补的关键。
您的尝试方法也较为可靠,仅需要在差值计算方法上作进一步研究,或与时间序列法相结合。如果您有任何疑问或需要具体分析过程,可以随时沟通,祝君好运