训练时是以1000个数据(是个时间序列)为一组(已知类别)进行训练,但测试时要判断连续的数据是以哪里为分界点,分界点前为穿透前,分界后为穿透后
#写入代码 chunker = pd.read_csv('train.csv', chunksize=1000) chunker
<pandas.io.parsers.TextFileReader at 0x21346013388>
【思考】什么是逐块读取?为什么要逐块读取呢?