实验室和外界的医疗设备厂商进行合作,拿了一些数据过来让我们帮忙分析。但是第一步就卡住了,读取数据部分就完全搞不定。
数据的情况是这样的:
是心电图的ecg数据,以.dat的形式进行存储的,使用了直接用rb的读取方式进行读取,但是出现各种编码不正确,不能读取的问题,pandas,numpy也没有。后来查了下资料,可能是MIT-BIH库的格式存储的,因此使用WFDB库进行读取,但是说没有.hea文件。因此特意去网上找了MIT-BIH库的文件,发现有.hea .dat .atr .xws4类文件,使用WFDB进行读取,能够正常读取。这时我就想我拿到的数据是不是也是这个MIT-BIH库格式的,因此拿着下载下来的这4类文件中的.dat文件,使用rb直接读取,也是各种编码问题,读取失败。于是我就坚信了是对方给我的数据少了.hea文件。我就和导师沟通,导师和对方沟通,结果对方的回复是确实只有.dat文件。因此我这里束手无策,大伙看看帮帮忙。解决一下。感激不尽
.dat只是data是缩写,表明它是个二进制文件,跟txt一样,并没有什么所谓固定的格式
你需要去问提供文件的人,文件里面的数据到底什么格式,而不是在这胡乱猜
经过多次反复8bits/12bits/16bits的尝试,最后得到结论是按照8bits的有符号数进行存储的