MATALB读入带有时间标志的TXT

MATALB无法读入带有时间标志的TXT

img

img


如图我有许多这种文件夹,一个文件夹内有许多组TXT,其中TXT打开如图二所示,我在使用txetread命令时读不出来?
想要的效果
把多个文件夹内的txt中的内容提取出来,按行排列,不要信息标签,组合到一个新的txt

是去掉日期标签吧


%读取路径下所有txt
files = dir('*.txt');
filesnames={files.name};
icount = size(files,1);
A_all={};
for i=1:1:icount
    %读取一个txt
   A= importdata(filesnames{1,i});
   icount2 = size(A,1);
    for j=1:1:icount2
        %元胞数组转化为字符串
        tempchar = char(A(j,:));
        %去掉日期标签????
        symbb = tempchar(1,5);
        if (strcmp(symbb,'-')==1)
            continue;
        end
        %如果不是日期标签就存起来
        A_all=[A_all;A(j,:)];
    end
end

fid=fopen('result.txt','w');
icount = size(A_all,1);
for i=1:1:icount
    fprintf(fid,'%s\r\n',A_all{i});
end
fclose(fid);

img

用python写更容易些

import glob
import re

def main():
    root_dir = '.'
    with open('output.txt', 'w') as output:
        for fname in glob.glob(root_dir + '/**/*.txt', recursive=True):
            with open(fname, 'r') as input:
                for line in input.readlines():
                    if not re.search('[0-9]{4}-[0-9]{2}-[0-9]{2}', line):
                        output.write(line)

if __name__ == '__main__':
    main()