怎么统一多个时间序列时间间隔不同的问题

因为是多个传感器收集的数据,每个传感器的频率不一样,有的一毫秒出两三个数据,有的两三毫秒出一个数据。要做多元回归分析,每个变量的每个时间段对应一个数据,想实现划分统一的时间段,每个时间段里的多个数据求平均,最终每个时间段对应一个数据,这种怎么实现

在选择好时间间隔后,可以用pandas的resample来操作。见下面例子:

import pandas as pd
from pandas.tseries.offsets import Hour,Second
import numpy as np
import datetime
data = pd.read_csv('fuel.csv')
data['date'] = pd.to_datetime(data['date'], format='%Y-%m-%d %H:%M:%S')
# frequency = 1
# time_range = pd.date_range(data['date'][0], data['date']
#                            [data.shape[0]-1]+frequency*Hour(), freq='%sH' % frequency)
data.set_index('date', inplace=True)  # 把时间列作为索引
#ticks = data.iloc[:]
bars = data.resample('h').mean().dropna().reset_index()  # 切分

print(bars)

传感器是变频的还是定频的?
定频的话,问题简单了。n个定频的传感器,数据输出是有规律的,取最小公倍数作为一个基准时间段,在一个基准时间段里做时间分划,以后的数据输出的时间序列就会是重复的,多元分析在此一个个基准时间段内执行即可。
变频的话,问题的难度大幅增加,无规律可言的变频只能将时间序列无限放大,or,只模拟一个指定的时间段,去除时间序列的概念,将整个模拟时间段内收到的数据进行多元回归分析。

没有具体项目,仅凭猜测
以上,希望有帮助

img

img

首先拿到一个数据表,只要某一个sensor有数据就打一个点,表里就给出一个时间点。自己指定一个时间段t1-tn,比如2010-02-17的全天或者2010-02一整个月的数据

img

用python的多元分析工具,引入pandas,numpy等一些包,n个传感器数据为自变量,实际运行情况为因变量,用公式去获取模型的偏回归系数(相当于离散型的数据获取模型)。至于模型的选择和传感器自身的业务场景相关,数据模型的筛选楼主可以自行选择

img

这个问题本身来看,是数据预处理加上用python分析得到一个时间段的模型,在往后的时间段内进行回测验证的过程。一般来说,时间段的选取越长,模型应该越精准